기사 원문 - https://www.tomshardware.com/pc-components/cpus/microsoft-introduces-newest-in-house-ai-chip-maia-200-is-faster-than-other-bespoke-nvidia-competitors-built-on-tsmc-3nm-with-216gb-of-hbm3e 마이크로소프트는 최신 AI 가속기인 마이크로소프트 애저 마이아 200을 출시했습니다 . 이 새로운 자체 개발 AI 칩은 마이크로소프트의 마이아 GPU 제품군의 차세대 제품으로, 아마존과 구글 등 하이퍼스케일 경쟁업체의 맞춤형 제품을 능가하는 초고속 및 강력한 처리 능력으로 AI 모델 추론을 위해 설계된 서버 칩입니다.
마이아 200은 마이크로소프트가 지금까지 출시한 "가장 효율적인 추론 시스템"으로 불리며, 모든 보도 자료에서 뛰어난 성능을 자랑하는 동시에 마이크로소프트의 환경주의에 대한 형식적인 언급만 강조하고 있습니다. 마이크로소프트는 마이아 200이 1세대 마이아 100 보다 가격 대비 성능이 30% 향상되었다고 주장 하는데, 이는 신형 칩의 TDP가 이전 모델보다 50% 높아졌다는 점을 고려하면 매우 인상적인 성과입니다.
마이아 200은 TSMC의 3nm 공정으로 제작되었으며 1400억 개의 트랜지스터를 포함하고 있습니다. 마이크로소프트는 이 칩이 최대 10페타플롭스의 FP4 연산 성능을 낼 수 있다고 주장하는데, 이는 아마존의 트레이니움3(Trainium3) 보다 3배 높은 수치 입니다. 또한 마이아 200은 7TB/s의 HBM 대역폭을 제공하는 216GB의 HBM3e 메모리와 272MB의 온칩 SRAM을 탑재하고 있습니다.
위에서 볼 수 있듯이, 마이아 200은 아마존 자체 개발 경쟁 제품과 비교했을 때 순수 연산 능력에서 확실한 우위를 점하고 있으며, 엔비디아의 최상위 GPU와 비교해 볼 만한 흥미로운 지점을 제시합니다. 물론 두 제품을 직접 비교하는 것은 무의미합니다. 외부 고객은 마이아 200을 직접 구매할 수 없고, 블랙웰 B300 울트라는 마이크로소프트 칩보다 훨씬 고성능 환경에 맞춰 설계되었으며, 엔비디아의 소프트웨어 스택은 동시대의 어떤 제품보다 훨씬 앞서 나가기 때문입니다.
마이아 200은 효율성 면에서 B300을 능가하는데, 이는 AI의 환경적 영향에 대한 여론이 점점 거세지는 요즘 같은 시기에 큰 성과입니다. 마이아 200은 B300의 TDP(1400W)의 거의 절반 수준인 750W로 작동하며, 마이아 100과 비슷하다면 이론상 최대 TDP 이하로 작동할 것입니다. 마이아 100은 700W 칩으로 설계되었지만, 마이크로소프트는 실제 작동 시에는 500W로 제한되었다고 주장했습니다.
Maia 200은 FP4 및 FP8 성능에 최적화되어 있으며, 복잡한 연산보다는 FP4 성능을 중시하는 AI 모델 추론 사용자를 위해 설계되었습니다. 마이크로소프트는 이 칩 개발에 상당한 연구 개발 예산을 투자했는데, 특히 272MB의 고효율 SRAM 뱅크에 메모리 계층 구조를 구축하는 데 집중했습니다. 이 SRAM은 "다중 계층 클러스터 레벨 SRAM(CSRAM)과 타일 레벨 SRAM(TSRAM)"으로 분할되어 운영 효율성을 높이고, 모든 HBM 및 SRAM 다이에 워크로드를 지능적이고 균등하게 분산하는 설계 철학을 구현합니다.
마이아 200이 이전 모델인 마이아 100에 비해 얼마나 개선되었는지 측정하기는 어렵습니다. 마이크로소프트가 공개한 두 칩의 공식 사양표에는 겹치는 부분이나 공통 측정 항목이 거의 없기 때문입니다. 현재로서는 마이아 200이 마이아 100보다 발열이 더 심하고, 가격 대비 성능은 약 30% 향상된 것으로 보입니다.
Maia 200은 이미 마이크로소프트의 미국 중부 Azure 데이터 센터에 배포되었으며, 향후 애리조나주 피닉스의 미국 서부 3 데이터 센터에도 배포될 예정이고, 마이크로소프트가 추가 칩을 확보하는 대로 더 많은 곳에 배포될 것입니다. 이 칩은 마이크로소프트의 이기종 배포 환경의 일부로, 다른 다양한 AI 가속기와 함께 작동할 예정입니다.
원래 코드명 브라가(Braga)였던 마이아 200(Maia 200)은 개발 및 출시가 크게 지연되면서 화제를 모았습니다 . 이 칩은 2025년 출시 및 배포를 목표로 했으며, 어쩌면 B300보다 먼저 시장에 나올 수도 있었지만, 결국 그렇게 되지 못했습니다. 마이크로소프트의 차기 하드웨어 출시는 아직 확정되지 않았지만, 10월 보도에 따르면 인텔 파운드리(Intel Foundry)의 18A 공정 으로 제조될 가능성이 높습니다 .
마이크로소프트가 마이아 200과 관련하여 효율성을 최우선으로 강조하는 메시지는 최근 자사 데이터 센터 인근 지역 사회에 대한 기업의 관심을 강조 하고 AI 붐에 대한 반발을 잠재우기 위해 상당한 노력을 기울이는 추세와 맥락을 같이합니다. 마이크로소프트 CEO 사티아 나델라는 최근 세계경제포럼에서 기업들이 AI 개발과 데이터 센터 구축의 이점을 대중에게 제대로 보여주지 못하면 "사회적 지지"를 잃고 우려되는 AI 거품을 초래할 위험이 있다고 경고했습니다 .
|