메인 콘텐츠로 건너뛰기
page thumbnail

Azure Cobalt 200 132코어 ARM CPU, 마이크로소프트는 무엇을 노리는가?

DODOSEE
DODOSEE
조회수 59
요약

클립으로 정리됨 (생성형 AI 활용)

출처 및 참고 : https://www.youtube.com/watch?v=8J7kU-IwCv8

Generated image

마이크로소프트가 132코어 ARM 기반 CPU 'Azure Cobalt 200'를 직접 설계해 데이터센터에 투입하기 시작했습니다. 단순한 신형 서버 칩 소개 수준이 아니라, 클라우드와 AI 인프라 전략 전체가 바뀌고 있다는 신호에 가깝습니다.

이 글에서는 Cobalt 200의 핵심 스펙, 마이크로소프트가 직접 CPU를 설계하는 이유, ARM이 데이터센터에서 갖는 의미, 기존 CPU 생태계에 미치는 파장을 차례대로 정리해 봅니다.

AI 인프라와 클라우드 CPU에 관심 있는 IT/개발·기획 직군이라면, 마이크로소프트의 이 행보가 앞으로 어떤 변수로 작용할지 파악하는 데 도움이 될 것입니다.

Azure Cobalt 200, 132코어 ARM 서버 CPU의 정체

Azure Cobalt 200은 마이크로소프트가 Azure 데이터센터용으로 설계한 2세대 ARM 서버 CPU입니다. 이미 1세대인 Cobalt 100이 상용 서비스에 투입된 상태였고, 이번에 성능과 효율을 크게 끌어올린 후속 버전이 공개됐습니다.

Cobalt 200의 가장 눈에 띄는 특징은 132개의 ARMv9.2 64비트 코어입니다. 기본 구조는 ARM의 서버용 아키텍처인 Neoverse V3를 기반으로 하며, 인스턴스당 원래 64코어까지 지원하는 설계를 66코어까지 확장하고, 이 칩을 두 개의 칩렛으로 묶어 하나의 SoC에서 132코어를 구현한 구조로 보입니다.

각 코어에는 L2 캐시 3MB가 붙어 있고, 전체 칩은 TSMC 3nm 공정에서 생산됩니다. 제조는 파운드리 위탁이지만, 설계와 통합은 마이크로소프트가 직접 수행하며, 이미 이 프로세서를 탑재한 메인보드가 데이터센터에서 가동 중입니다.

마이크로소프트는 Cobalt 200이 Cobalt 100 대비 성능이 약 50% 향상됐다고 밝히고 있습니다. 같은 랙, 같은 전력에서 처리할 수 있는 워크로드가 크게 늘어난다는 의미이며, 클라우드 사업자 입장에서는 곧바로 수익성과 직결됩니다.

전체적인 양산 및 대규모 배포는 2026년까지 단계적으로 진행될 예정입니다. 즉, 지금 발표는 시작점에 가깝고, 향후 1~2년 안에 ARM 기반 Azure 인스턴스 비중이 눈에 띄게 늘어날 가능성이 높습니다.

마이크로소프트는 왜 직접 서버 CPU를 설계하나

가장 핵심적인 동기는 비용, 성능, 전력 효율입니다. 이 세 가지는 서로 맞물려 돌아가며, 특히 거대 클라우드 사업자 입장에서는 한 항목만 개선해도 연간 단위로 막대한 금액 차이가 발생합니다.

먼저 비용 측면에서, 전통적으로 데이터센터 CPU는 Intel 또는 AMD에서 구매하는 구조였습니다. 이 경우 칩 가격에는 제조사 마진, 유통 마진, 자체 R&D 비용 등이 모두 포함됩니다. 마이크로소프트 입장에서는 대규모로 칩을 구매할수록 이 마진이 그대로 고정비로 남습니다.

직접 설계한 Cobalt 계열 CPU를 사용하면, 외부 업체의 이윤과 마진을 줄이고 내부 최적화에 투자할 수 있는 구조가 만들어집니다. Azure처럼 규모가 큰 클라우드에서는 이 정도 차이만으로도 연간 수억 달러 단위 비용 절감이 가능할 것으로 예상됩니다.

두 번째는 성능입니다. 마이크로소프트는 Azure의 실제 워크로드와 인프라 특성을 누구보다 잘 알고 있습니다. 이때 범용 CPU가 아니라 자체 워크로드에 맞춰 설계된 CPU를 사용하면, 같은 전력·같은 공간에서 더 높은 처리량을 끌어낼 수 있습니다.

실제로 마이크로소프트는 코어 개수, 캐시 크기, 네트워크 토폴로지, 서버 구성, 메모리 대역폭 등을 조합해 2,800가지 설계 변형을 만들었습니다. 이어 이를 랙·서버·메인보드 구조까지 포함해 시뮬레이션하면서 35만 개가 넘는 구성 조합을 검토한 뒤, 성능과 전력 효율을 동시에 극대화할 수 있는 구성을 골라 Cobalt 200 설계에 반영했습니다.

세 번째는 통제력입니다. 마이크로소프트는 Cobalt 200을 통해 하드웨어부터 소프트웨어까지 수직 통합된 스택을 구축하고 있습니다. CPU 설계, 서버 구조, 랙 토폴로지, 하이퍼바이저, 운영체제, 클라우드 플랫폼, AI 서비스까지 하나의 그림으로 조정할 수 있습니다.

이 구조에서는 외부 CPU 로드맵을 기다릴 필요 없이, 필요한 기능을 내부 일정에 맞춰 반영할 수 있고, 특정 워크로드에 특화된 라인업을 병행하는 것도 상대적으로 수월해집니다.

ARM 아키텍처와 AI 시대의 데이터센터 전력 문제

Cobalt 200이 ARM 기반이라는 점은 단순한 선택이 아니라, 전력 효율을 겨냥한 전략으로 볼 수 있습니다. ARM은 원래 스마트폰, 태블릿, 노트북 등 배터리 기반 기기에서 성능 대비 전력 효율을 높이는 데 최적화된 아키텍처입니다.

현재 스마트폰과 iPhone, MacBook Air 등에 쓰이는 칩 대부분이 ARM 계열입니다. 이 아키텍처가 가진 가장 큰 장점은 같은 연산을 더 적은 전력으로 처리할 수 있다는 점입니다.

이 특성이 데이터센터로 확장될 경우 의미는 크게 달라집니다. 데이터센터는 수천, 수만 대의 서버가 모여 있는 시설이고, 전력 사용량이 곧 운영비와 직결됩니다. 서버 한 대에서 몇 와트를 아끼는 수준이 아니라, 랙 단위, 클러스터 단위로 보면 절감되는 전력이 메가와트(MW) 규모가 될 수 있습니다.

AI 붐이 본격화되면서 GPU 클러스터, 메모리, 네트워크 장비가 대거 추가되고 있고, 각국 정부가 지원하는 AI 데이터센터도 빠르게 늘어나는 중입니다. 이 과정에서 전력 수급이 주요 이슈로 떠오르고 있으며, 전력 대비 성능이 높은 ARM 서버 CPU는 클라우드 사업자의 선택지로 점점 더 매력적인 위치를 차지하게 됩니다.

또한 ARM은 이미 엔비디아의 Grace Superchip, Jetson Thor 등 다양한 AI 플랫폼에서도 사용되고 있습니다. CPU는 ARM, 가속기는 엔비디아 GPU라는 조합이 자연스러운 패턴으로 굳어지는 중이며, Cobalt 200 역시 이 흐름 위에서 설계된 선택에 가깝습니다.

Cobalt 200과 Azure 인프라: CPU·GPU 혼합 전략

마이크로소프트는 Azure 인프라에서 CPU 전용 서버와 CPU+GPU 혼합 서버를 모두 운용해야 합니다. 전통적인 웹·데이터베이스·마이크로서비스 워크로드와, 대규모 AI 학습·추론 워크로드가 동시에 존재하기 때문입니다.

Cobalt 200 기반 서버는 이 두 영역을 모두 겨냥할 수 있습니다. 일반적인 클라우드 워크로드에는 고코어·고효율 ARM CPU만으로 충분한 경우가 많고, AI 워크로드에는 엔비디아 GPU를 탑재한 ARM 기반 서버를 구성하는 방식으로 확장할 수 있습니다.

엔비디아는 이미 ARM CPU와 GPU를 한 패키지에 결합한 Grace Superchip과, 임베디드·엣지용 Jetson Thor 같은 플랫폼을 통해 ARM+GPU 조합을 적극 활용하고 있습니다. Azure는 이 생태계 위에서 ARM 기반 CPU 서버GPU 가속 서버를 함께 운영하며, 필요에 따라 GPU가 없는 저비용 인스턴스와 GPU가 포함된 고성능 인스턴스를 유연하게 설계할 수 있습니다.

이때 마이크로소프트가 서버 설계와 랙 토폴로지까지 직접 통제하기 때문에, CPU와 GPU 간 대역폭, 네트워크 구성, 냉각 설계 등도 클라우드 서비스 특성에 맞춰 미세 조정이 가능합니다.

결과적으로 Cobalt 200은 단순한 '자체 개발 ARM CPU'가 아니라, Azure 전체 인프라 구조를 ARM 중심으로 재편할 수 있는 발판에 가깝습니다.

x86 생태계에 미칠 파장과 Azure 고객 관점의 변화

Cobalt 200의 등장은 Intel·AMD 중심의 x86 서버 시장에도 의미 있는 압력을 가할 가능성이 있습니다. 마이크로소프트 같은 대형 고객이 자체 CPU 비중을 늘릴수록, 기존 x86 CPU 업체가 공급할 수 있는 물량과 단가 구조는 변화할 수밖에 없습니다.

다만 Azure 입장에서는 x86을 완전히 대체하기보다는, 용도에 따라 x86과 ARM을 병행하는 전략에 가까울 가능성이 큽니다. 고성능 단일 스레드 성능이 중요한 특정 워크로드나, 기존 소프트웨어 호환성이 핵심인 경우에는 여전히 x86 인스턴스가 필요하기 때문입니다.

Azure를 이용하는 고객 입장에서는 ARM 기반 인스턴스 선택지가 점점 늘어날 가능성이 높습니다. 특히 다음과 같은 경우에 ARM 인스턴스가 유리할 수 있습니다.

  • 컨테이너 기반 마이크로서비스, 웹 서버, API 서버 등 수평 확장이 쉬운 워크로드

  • 언어 런타임·프레임워크가 ARM을 공식 지원하는 현대적인 스택

  • 비용 대비 처리량이 중요한 배치 작업, 로그 처리, 스트리밍 처리

반대로, 레거시 x86 바이너리 의존도가 높거나, 특정 상용 솔루션이 ARM을 지원하지 않는 환경에서는 x86 인스턴스를 유지할 필요가 있습니다.

마이크로소프트는 Cobalt 200의 50% 성능 향상을 전면에 내세우고 있지만, 실제 클라우드 사용자에게 중요한 것은 벤치마크 수치 자체보다도 같은 비용에서 얼마나 많은 작업을 처리할 수 있는지, ARM 전환에 따른 마이그레이션 부담은 어느 정도인지입니다. 이 부분이 명확해질수록 ARM 인스턴스 채택 여부를 판단하기 쉬워질 것입니다.

Azure Cobalt 200이 던지는 신호와 현실적인 관찰

Cobalt 200에 관한 공개 정보만 놓고 보면, 마이크로소프트의 전략은 꽤 일관된 방향을 보여줍니다. AI 시대의 데이터센터 폭증, 전력·비용 압박, 수직 통합을 통한 통제력 강화라는 세 가지 흐름에서 Cobalt 200은 자연스러운 선택처럼 보입니다.

다만 몇 가지 현실적인 제약도 예상됩니다. ARM 서버 생태계는 빠르게 성장 중이지만, 소프트웨어 호환성, 서드파티 솔루션 지원, 운영팀의 경험 부족 등은 아직 x86 대비 불리한 요소로 남아 있습니다. 마이크로소프트 내부 워크로드는 조정이 상대적으로 수월하겠지만, 서드파티 ISV와 대형 엔터프라이즈 고객이 ARM으로 완전히 넘어오는 데는 시간이 필요합니다.

또한 마이크로소프트가 CPU 설계를 직접 수행하고, TSMC 3nm 공정에 의존한다는 점에서 공급망 리스크도 존재합니다. 첨단 공정은 생산 캐파가 제한적이고, 다른 반도체 업체와의 경쟁도 치열합니다. 대규모 AI GPU, 콘솔, 클라이언트 PC용 칩 등과 같은 라인을 공유할 경우, 수요 급증 시 일정 조정이 필요할 수밖에 없습니다.

그럼에도 불구하고, 한 가지 흐름은 분명해 보입니다. 대형 클라우드 사업자는 점점 더 자체 설계 CPU와 맞춤형 인프라를 통해 원가 구조를 개선하고, 서비스 차별화를 시도하고 있습니다. AWS의 Graviton, 구글의 자체 칩, 그리고 마이크로소프트의 Azure Cobalt 라인이 같은 방향을 가리키고 있습니다.

향후 관전 포인트는 Cobalt 200 기반 Azure 인스턴스가 실제로 어떤 가격·성능·전력 효율 프로필을 보여줄지, 그리고 이로 인해 x86 중심 클라우드 사용 패턴이 어느 정도까지 재편되는지가 될 것입니다.

Azure 사용자는 앞으로 "x86 vs ARM" 선택이 기본 옵션으로 자리 잡는 환경에 익숙해질 필요가 있고, 인프라 설계자는 장기적으로 ARM 기반 아키텍처를 전제로 한 설계 전략까지 검토해야 할 시점에 가까워지고 있습니다.

출처 및 참고 :

이 노트는 요약·비평·학습 목적으로 작성되었습니다. 저작권 문의가 있으시면 에서 알려주세요.