
AI 칩 공급망, 누가 진짜 판을 짜는가

AI 붐 뒤에서 조용히 힘을 키운 몇 개의 회사들
챗GPT니 생성형 AI니 하는 말은 익숙해졌지만 정작 많은 사람은 한 가지를 놓칩니다. 이 모든 서비스의 성패가 몇 개 회사의 칩과 장비에 사실상 목줄이 잡혀 있다는 점입니다. 겉으로는 모델 성능 경쟁처럼 보이지만 안쪽에서는 GPU와 파운드리, 그리고 극자외선 장비를 가진 소수 기업의 힘 겨루기가 진행 중입니다.
NVIDIA와 AMD는 GPU 시장을 쥐고 있지만 직접 칩을 찍어내지 않습니다. TSMC와 삼성 같은 파운드리에 설계 도면을 넘기고 생산을 맡깁니다. 겉으로는 멋진 아키텍처와 소프트웨어 생태계가 주목을 받지만, 실제로는 안정적으로 수백만 개 칩을 뽑아 줄 제조 파트너와의 관계가 진짜 경쟁력입니다. 제 기준에서는 "좋은 설계"보다 "줄 서지 않고 물량을 받아 올 수 있는가"가 요즘 AI 기업의 실력에 더 가깝습니다.
AI 회사 입장에서는 이 구조가 득이 되기도 하고 독이 되기도 합니다. 클라우드 크레딧으로 GPU를 빌려 쓰는 스타트업이라면 당장 공장 걱정을 하지 않아도 됩니다. 반대로, 대형 서비스 사업자라면 특정 파운드리에 지나치게 의존하는 순간 협상력이 약해집니다. 같은 칩을 쓰는 경쟁사가 더 좋은 가격이나 우선 물량을 받는 순간, 성능보다 조달이 사업을 가릅니다.
GPU 스펙보다 공급망이 더 무서운 이유
H100이냐 B100이냐 같은 스펙 토론은 화려합니다. 그러나 대규모 서비스를 준비하는 입장에서는 질문이 조금 달라집니다. "내가 원하는 시점에 원하는 수량을 확보할 수 있는가"가 핵심입니다. 공급이 막히면 모델 아키텍처나 프롬프트 최적화 따위는 의미가 줄어듭니다.
이 구조는 국내 기업에도 그대로 들어옵니다. 한국에서 AI 서비스를 준비하는 팀이 아무리 잘 설계된 모델을 만들어도, 결국 TSMC 라인 배정과 NVIDIA 공급 우선순위의 영향을 받습니다. 개인적으로는 향후 몇 년간 한국 기업의 AI 전략에서 모델 연구보다 장기 GPU 확보 전략이 더 중요한 변수라고 봅니다.
소프트웨어 팀도 하드웨어 지형을 알아야 하는 이유
개발자 입장에서는 "저건 반도체 회사가 고민할 일"로 느껴질 수 있습니다. 그러나 모델 크기, 정밀도, 훈련 주기 같은 기술적 선택이 결국 하드웨어 수급 전략과 직결됩니다. 같은 성능을 내면서도 더 적은 GPU로 버티는 아키텍처를 선택한 팀은, 공급망 리스크를 그만큼 줄이는 셈입니다.
반대로, GPU가 싸지고 무한히 공급된다는 가정으로만 사업 계획을 세우면 위험합니다. 특정 시점에 미국 수출 규제가 강화되거나, ASML 장비 리드 타임이 늘어나거나, 대형 빅테크가 물량을 선점하면 후순위 고객은 바로 대기열 뒤로 밀립니다. 이 현실을 모르면, 갑작스러운 훈련 지연을 "운 없었다" 정도로만 오해하게 됩니다.
모래에서 EUV까지, AI 칩을 둘러싼 보이지 않는 병목
AI 칩 공급망은 생각보다 원초적인 곳에서 시작합니다. 해변의 모래와 비슷한 규소에서 출발해, 수십 개 공정을 거쳐 데이터센터 안의 거대한 GPU 보드로 변합니다. 이 긴 여정의 어느 한 단계만 틀어져도 최종적으로는 "GPU 못 구함"이라는 한 줄 메시지로 체감됩니다.
HPQ와 원자재, 감춰진 시작점
반도체의 출발점은 고순도 석영입니다. 지구에는 모래가 넘쳐나지만, 반도체용으로 바로 쓸 수 있는 고순도 고품질 석영은 제한적입니다. 미국 노스캐롤라이나의 한 광산이 세계 공급의 상당 부분을 책임지는 구조입니다. 한 나라의 한 지역 광산에서 문제가 생기면, 몇 년 뒤 특정 공정 비용이 올라가고, 그 여파가 결국 GPU 가격과 리드 타임에 반영됩니다.
중국이 자국 내 고순도 석영 매장량을 확보하려는 것도 같은 맥락입니다. 장기적으로는 미국 광산 의존도를 낮추고 싶어 합니다. 다만 원재료를 캐냈다고 끝이 아닙니다. 정제 설비와 품질 관리, 이후 웨이퍼 공정까지 이어지는 전체 체인이 필요합니다. 안정적인 장기 인프라 투자 여력이 있는 대형 기업과 국가가 유리한 구조입니다. 반대로 단기 성과에 쫓기는 기업에는 거의 손댈 수 없는 영역입니다.
ASML과 EUV, 진짜 '목줄'을 쥔 곳
칩 생산 과정 중에서도 가장 강력한 병목은 포토리소그래피입니다. 3나노, 5나노급 공정을 위해 필요한 EUV 스캐너는 사실상 네덜란드의 ASML이 독점하고 있습니다. 장비 한 대 가격이 몇 백만 원이 아니라 몇 천억 원 수준입니다. 게다가 장비를 주문한다고 바로 받지도 못합니다. 라인 구축까지 몇 년 단위의 계획이 필요합니다.
이 말은 곧, 앞으로 몇 년간 어느 나라, 어느 파운드리가 첨단 AI 칩을 얼마나 찍어낼 수 있는지, 상당 부분이 이미 예약된 장비 숫자로 정해져 있다는 뜻입니다. 한국 기업이 TSMC나 삼성에 의존하는 이유도 여기에 있습니다. 국내에서 EUV 장비를 새로 들여와 최첨단 파운드리를 새로 만든다는 계획은 말로는 가능하지만 현실적으로는 엄청난 자본과 시간이 필요합니다. 제 기준에서는 개별 기업이 단독으로 도전할 스케일이 아니라 국가 전략 차원에서만 의미가 있습니다.
중국의 추격과 미국 진영의 방어선, 그 사이에 낀 한국
AI 칩은 기술 경쟁인 동시에 지정학 경쟁입니다. 미국은 설계 IP와 장비, 첨단 파운드리를 쥐고 있고, 중국은 엄청난 시장과 국가 주도 투자를 기반으로 격차를 줄이려 합니다. 그 사이에 한국과 대만, 네덜란드 같은 나라가 각각의 위치에서 공급망의 필수 조각을 담당합니다.
중국의 '독립 선언'이 쉽지 않은 이유
중국은 화웨이와 SMIC를 앞세워 자체 GPU와 파운드리 역량을 키우려 합니다. 자체 고순도 석영 매장지를 확보하고, EUV 없이 쓸 수 있는 DUV 공정을 극한까지 밀어붙이는 전략입니다. 실제로 특정 공정에서는 생각보다 빠른 추격을 보여줍니다. 다만 최고 성능 영역에서는 여전히 차이가 큽니다.
칩 설계 IP와 EDA 툴에서 ARM, 시놉시스, 케이던스 같은 미국·영국계 회사 의존도가 높다는 점도 걸림돌입니다. 하드웨어를 만드는 능력뿐 아니라, 2000억 개 트랜지스터를 안전하게 설계하고 검증할 수 있는 소프트웨어 생태계가 필요합니다. 이 부분은 돈만 투자해서 단기간에 따라잡기 어렵습니다. 그래서 중국 칩은 현재로서는 고성능 훈련용보다는, 자국 내 서비스용 추론 칩을 중심으로 확산되는 모습입니다.
미국 진영의 전략, '속도전'과 '규모전'
미국과 동맹국은 이미 갖고 있는 우위를 더 벌리는 방향을 택했습니다. TSMC와 삼성은 3나노 이하 공정 양산을 서두르고, NVIDIA와 AMD, 구글, 마이크로소프트는 각자 차세대 AI 칩을 쏟아냅니다. 중국의 진입을 막는 동시에, 자체 공급망을 더 밀도 있게 묶으려는 전략입니다.
국내 기업과 스타트업에게는 이 구도가 양날의 검입니다. 한편으로는 동맹 프리미엄 덕분에 첨단 칩에 상대적으로 더 빨리 접근할 기회가 생깁니다. 다른 한편으로는 미국 빅테크가 먼저 물량을 선점하기 때문에, 후순위 고객인 한국 회사는 가격과 리드 타임에서 밀릴 수 있습니다. 개인적으로는 국내 AI 스타트업이 미국 빅테크와 정면으로 GPU 물량을 두고 싸우기보다는, 그들이 구축한 인프라 위에서 틈새 버티컬을 공략하는 전략이 현실적이라고 봅니다.
누가 이 공급망에서 진짜 이익을 가져가는가
AI 버블 이야기가 나올 때마다 "누가 최후의 승자인가"라는 질문이 반복됩니다. 눈에 잘 보이는 승자는 NVIDIA 같은 GPU 설계사입니다. 그러나 공급망 전체를 보면, 조용히 웃는 플레이어들이 더 있습니다. ASML, TSMC, 삼성 같은 곳이 대표적입니다.
칩 설계사와 파운드리, 힘의 균형
칩 설계사는 고부가가치 브랜드를 만들 수 있습니다. CUDA 생태계나 가속기용 소프트웨어 툴체인을 장악하면 잠깐 성능이 밀려도 고객이 쉽게 떠나지 않습니다. 그래서 NVIDIA의 "해자"가 두껍다는 말이 나옵니다. 다만 생산을 스스로 하지 못하기 때문에 파운드리와의 관계에서 완전히 우위에 서기는 어렵습니다.
파운드리는 반대로 브랜드는 약하지만 필수 설비를 쥐고 있습니다. 공정 노드 하나를 낮출 때마다 엄청난 투자비와 리스크가 따릅니다. 대신 한 번 기술 격차를 벌려 놓으면 따라오기가 매우 어렵습니다. 이 구조에서 자금과 수요를 동시에 보장해 줄 고객, 예를 들면 애플이나 NVIDIA 같은 회사와의 장기 계약이 중요한 자산이 됩니다. 한국 입장에서는 삼성 파운드리의 경쟁력이 국가 전체 AI 전략의 하드웨어 기반이라고 봐도 과장이 아닙니다.
이 정보가 의미 있는 사람과, 굳이 신경 쓰지 않아도 되는 사람
AI 서비스나 인프라를 직접 기획하는 사람에게는 이 공급망 구조가 매우 중요합니다. GPU를 자체 구매할지, 클라우드 기반으로 갈지, 어느 지역 리전에 의존할지 같은 의사결정의 배경이 됩니다. 반대로, AI를 단순히 SaaS 형태로 도입해 쓰는 정도라면 여기까지 깊게 알 필요는 없습니다. SLA와 비용이 핵심입니다.
여기서 많이 놓치는 부분은, 중간 단계에 있는 기업입니다. 자체 모델은 없지만, 특정 도메인에서 맞춤형 파이프라인을 구축하는 SI·컨설팅·플랫폼 회사들입니다. 이런 회사들은 "GPU를 얼마나 오래, 얼마나 안정적으로 쓸 수 있는가"를 사업 리스크로 인식해야 합니다. 공급망 리스크를 완전히 통제할 수 없기 때문에, 멀티 클라우드 전략이나, 모델 크기와 정밀도를 탄력적으로 바꾸는 기술적 옵션을 미리 준비하는 편이 낫습니다.
AI 인프라 전략, 시작 전 반드시 체크할 것
AI 공급망 이야기는 거대 기업과 국가 차원의 문제처럼 들리기 쉽습니다. 그러나 실제로는 중견기업 한 곳의 투자 결정, 스타트업 한 팀의 아키텍처 선택 같은 작은 선택 위에서도 영향을 줍니다. 섣불리 "GPU만 많이 사면 된다"라고 생각하면 나중에 발목을 잡힙니다.
현실적 제약, 그리고 흔한 착각들
첫째, 대부분의 기업은 NVIDIA와 TSMC, ASML 같은 플레이어와 직접 협상할 위치에 있지 않습니다. 결국 클라우드 사업자나 국내 대형 IT 기업을 경유하게 됩니다. 이 과정에서 가격과 우선순위, 리전 선택권이 한 번 더 필터링됩니다. 그래서 실제로 받을 수 있는 성능과 가용성이, 마케팅 자료에서 본 것과 다를 수 있습니다.
둘째, 공급망 리스크는 한 번에 터지지 않습니다. 먼저 리드 타임이 조금씩 늘어나고, 특정 모델의 재고가 불안정해지고, 결국에는 신규 프로젝트 착수가 미뤄지는 식으로 나타납니다. IT 실무 입장에서는 "조금 느려졌네" 정도로 느끼다가, 어느 순간 주요 경쟁사가 먼저 물량을 확보했다는 사실을 뒤늦게 알게 됩니다. 제 기준에서는 연간 인프라 계획을 세울 때, 기술 로드맵과 별도로 "GPU 조달 시나리오"를 최소 두 개 이상 준비하는 것이 안전합니다.
지금 할 수 있는 첫 번째 행동
당장 할 수 있는 일은 거창한 팹 투자나 정부 정책 제안이 아닙니다. 자기가 속한 조직이 공급망에서 어느 위치에 있는지부터 명확히 파악하는 일입니다. 직접 GPU를 사서 넣는 구조인지, 클라우드에 완전히 의존하는지, 특정 리전에 묶여 있는지, 벤더 락인은 어느 수준인지부터 정리하는 것이 좋습니다.
그다음에는 서비스와 모델의 중요도를 기준으로 A, B, C 등급을 나눌 필요가 있습니다. A 등급에는 상대적으로 안정적인 리전과 벤더를 쓰고, B, C 등급에는 비용 효율을 우선하는 선택을 하는 식입니다. 이 과정에서 자연스럽게 "어디까지가 사업 핵심인지"도 드러납니다. 공급망은 거대한 글로벌 이슈이지만, 실제 대응은 이런 소소한 설계와 선택에서 시작됩니다. AI 칩을 둘러싼 몇 개 회사의 힘을 이해하는 순간, 앞으로 5년 동안 어떤 인프라 전략이 현실적인지 보이기 시작합니다.
출처 및 참고 :
이 노트는 요약·비평·학습 목적으로 작성되었습니다. 저작권 문의가 있으시면 에서 알려주세요.
