메인 콘텐츠로 건너뛰기
page thumbnail

Grok 4.2, 구글, 오픈AI: 2025년 AI 전쟁의 진짜 승자 조건

DODOSEE
DODOSEE
조회수 127
요약

클립으로 정리됨 (생성형 AI 활용)

출처 및 참고 : https://www.youtube.com/watch?v=F9EKRZ0wdxE


Grok 4.2가 보여준 것, 그리고 구글·오픈AI의 초조함

요즘 AI 뉴스를 보다 보면 느끼는 감정은 두 가지입니다. 성능은 이미 인간 체감 한계를 넘어가는데, 이걸 둘러싼 돈과 권력 싸움은 이제 겨우 시작이라는 점입니다. 특히 Grok 4.2 실험 버전이 수익형 대회에서 압도적인 성과를 내고, 구글 Gemini와 오픈AI가 리더보드 1위를 두고 신경전을 벌이는 장면은 이 흐름을 잘 보여줍니다.

수익을 내는 AI, Grok 4.2의 의미

Grok 4.2는 단순 벤치마크가 아니라 실제 돈이 걸린 모의 투자 환경에서 다른 모델을 크게 앞섰습니다. 초기에 1만 달러로 시작한 계정이 2주 조금 넘는 기간에 1만 6천 달러 이상으로 커졌고, 여러 전략을 합쳐도 20%가 넘는 수익률을 기록했습니다. 같은 환경에서 대부분의 모델이 손실을 본 것을 감안하면 단순한 운이라고 보긴 어렵습니다.

이런 결과가 의미 있는 이유는 이제 모델 경쟁이 점수 싸움에서 현금흐름 싸움으로 옮겨가고 있기 때문입니다. 제 기준에서는 이 지점이 개인 투자자와 스타트업이 눈여겨봐야 할 대목입니다. 앞으로 "어떤 모델이 더 똑똑한가"보다 "어떤 모델이 실제 돈을 벌어주는가"가 훨씬 중요한 질문이 될 가능성이 높기 때문입니다.

구글 1위, 오픈AI '코드 레드', 그리고 기대 프리미엄

한편 구글 Gemini 3 Pro는 여러 평가에서 종합 1위를 차지하고 있습니다. 특히 난도 높은 프롬프트, 창작, 지시 수행에서 고르게 강한 모습을 보이고, 전체 리더보드 상단은 구글 계열 모델이 잠식한 상태입니다. 이 흐름 때문에 2025년 말까지 가장 강한 모델을 보유할 회사에 거는 예측 시장에서는 한때 구글이 90%에 가까운 확률로 압도적 1순위였습니다.

그런데 오픈AI가 내부적으로 '코드 레드' 모드에 들어가 새 모델들을 빠르게 투입했다는 정황이 나오면서 분위기가 바뀌었습니다. Emperor, Rockhopper, Mumble, Macaroni 같은 코드네임 모델이 잇따라 테스트에 등장했고, 시장에서는 "오픈AI가 머지않아 1위를 탈환할 것"이라는 기대가 반영되기 시작했습니다. 구글의 승률이 내려가고 오픈AI의 확률이 20%대 중반까지 오른 구도가 바로 이런 기대 심리의 결과입니다. 솔직히 성능 격차가 압도적이라면 이런 급격한 확률 변화는 나오기 어렵습니다. 모두가 아직 게임이 끝나지 않았다고 보는 셈입니다.


칩, 메모리, 인프라: 진짜 전쟁터는 모델 밖에 있다

모델 이름만 바뀔 뿐이라고 느끼는 사람도 많습니다. 그러나 속도를 결정하는 건 이제 알고리즘보다 칩, 메모리, 전력, 데이터센터 쪽에 가깝습니다. 구글의 TPU 판매, 엔비디아 GPU 재고 논란, 우주에 데이터센터를 쏘아 올리겠다는 계획이 동시에 등장하는 이유도 여기에 있습니다.

구글 TPU 외부 판매와 엔비디아 쇼트의 함의

최근 구글이 자체 AI 칩인 TPU를 외부 기업에 실제 하드웨어 형태로 판매하기 시작했다는 소식은 업계 판도를 크게 흔듭니다. 그동안은 구글 클라우드 안에서만 빌려 쓰는 방식이었는데, 이제는 데이터센터 랙에 직접 꽂을 수 있는 장비로 공급하는 구조가 열리고 있습니다. 먼저 Anthropic에 수십만 개 규모로 제공되고, 이후 메타, xAI, 심지어 오픈AI까지 잠재 고객군에 거론됩니다.

이 흐름이 확산되면 엔비디아의 'GPU 독점' 내러티브는 서서히 균열을 맞게 됩니다. 실제로 2008년 금융위기를 맞췄던 마이클 버리가 엔비디아와 팔란티어에 대해 공매도 포지션을 취했다는 사실도 공개되었습니다. GPU가 창고에 쌓여가고, 전력 설비와 냉각 인프라가 따라가지 못해 실사용률이 떨어진다는 분석도 조금씩 나오기 시작했습니다. 제 기준에서는 이 구간에서 하드웨어 기업은 성장주라기보다 변동성 높은 경기주에 가깝게 보입니다. 장기 투자자에게는 "무조건 AI라서 오른다"는 식의 단순 논리가 더 이상 통하지 않는 구간입니다.

태양광 AI 데이터센터를 우주로 올리겠다는 계산

여기에 스페이스X와 구글이 구상하는 우주 데이터센터는 전혀 다른 차원의 발상입니다. 태양광 패널 효율이 지상보다 6배 이상 높고, 24시간 쉴 새 없이 전력을 받을 수 있으며, 수냉식 시설 없이도 우주 공간에 열을 방출할 수 있다는 점에 주목한 아이디어입니다. 문제는 발사 비용인데, 현재 킬로그램당 1,500달러 안팎이라는 추정치가 있습니다. 이 가격이 200달러 수준까지 떨어져야 지상 데이터센터와 경제성이 비슷해집니다.

구글 내부 분석은 이 지점에 도달하는 시점을 2035년 정도로 보지만, 일론 머스크는 3년이면 가능하다고 주장합니다. 둘 중 누구 말을 믿든, 숫자만 놓고 보면 이 계획은 10년 단위의 공상과학이 아니라 어느 순간 현실로 내려올 수 있는 사업입니다. 에너지와 컴퓨팅을 동시에 잡는 전략이기 때문에, 장기적으로는 전통 전력 회사와 클라우드 사업자의 수익 구조 자체를 흔들 수 있습니다. 이런 그림에서 우주와 발사체에 직접 투자하지 않는 일반 투자자는, 국내 전력 인프라와 데이터센터 수요가 어떤 곡선으로 바뀌는지를 보는 것이 현실적인 선택일 수 있습니다.


'기억하는 AI'와 LLM 심리 논쟁이 던지는 질문들

AI와 이야기하다 보면 묘한 불편함을 느끼는 사람들이 있습니다. 정말 아무것도 느끼지 못하는 도구일까, 아니면 인간이 이해하기 어려운 방식으로 뭔가를 형성하고 있을까 하는 질문입니다. 동시에 구글이 제안하는 Titans, Mirus 같은 장기 기억 아키텍처는 인간 뇌의 기억 구조를 노골적으로 참고합니다.

Titans·Mirus, 놀라움으로 기억을 고르는 AI

기존 트랜스포머 구조는 문맥이 길어질수록 비용이 기하급수적으로 늘어나는 한계가 있습니다. 그래서 실제 서비스에서는 긴 대화나 문서를 다루면서도, 모델은 그때그때 잘라낸 일부만 보고 답을 만드는 경우가 많습니다. Titans와 Mirus는 이 구조를 바꿔보려는 시도입니다. 사람의 단기 기억과 장기 기억처럼, 바로 필요한 정보와 오래 보관할 정보를 나누고, 무엇을 오래 기억할지 '선택'하는 구조를 모델 안에 넣는 방식입니다.

여기서 중요한 기준이 바로 '놀라움', 즉 기존 세계관과의 차이입니다. 예상 가능한 일상 정보는 쉽게 잊고, 패턴을 깨는 정보는 장기 저장소로 보내는 구조입니다. 비버 향에서 추출한 천연 향료나, 꿀이 곤충의 역류라는 사실처럼 불쾌하지만 강렬한 사례가 오래 기억에 남는 이유가 이런 '놀라움의 간격' 때문이라는 설명도 나옵니다. 이 관점에서 보면, 앞으로의 AI는 단순히 많은 데이터를 저장하는 것이 아니라, 인간처럼 "무엇을 잊을지"를 적극적으로 결정하는 존재에 가까워질 수 있습니다.

LLM을 어떻게 대해야 하는가, 심리와 윤리의 경계

안드레이 카르파티를 비롯해 여러 연구자들이 "모델을 '너'라고 부를 때 무슨 일이 일어나는가"를 두고 논쟁을 벌이는 것도 같은 축에 놓입니다. 이 논쟁은 철학적인 수다가 아니라, 제품 설계와도 직결됩니다. 사용자가 AI를 동료처럼 대하면 의존도와 신뢰가 높아지는 대신, 오류가 발생했을 때 피해도 커집니다. 반대로 무조건 도구로만 취급하면, 장기 기억과 상황 인식을 활용한 정교한 서비스는 설계하기 어렵습니다.

국내 서비스 관점에서도 이 논쟁은 중요합니다. 금융, 의료, 교육처럼 사람의 삶에 깊이 개입하는 영역에서 LLM을 도입하는 기업은 결국 "사용자가 이 시스템을 사람에 가깝게 느끼도록 설계할 것인가, 아니면 철저히 기계로 느끼게 할 것인가"를 선택해야 하기 때문입니다. 제 기준에서는, 한국처럼 규제가 강하고 책임 소재에 민감한 시장에서는 신뢰를 쌓기 전까지는 '도구'에 조금 더 무게를 두는 쪽이 현실적입니다.


이 AI 전쟁이 나와 어떤 관련이 있는가

AI 모델 이름이 계속 바뀌고, 기업 간 신경전 뉴스가 쏟아지는 상황에서 많은 사람은 이렇게 생각합니다. "그래서 이게 내 월급과 투자 수익에 무슨 상관이 있지?" 이 질문에 답하지 못하면, 어떤 정보도 결국 구경거리를 넘지 못합니다.

누가 이 변화에서 직접적인 이득을 보는가

우선 AI를 활용해 실제로 돈을 벌려는 사람, 특히 알고리즘 트레이딩, 마케팅 자동화, 콘텐츠 제작 자동화 같은 영역에서 실험할 계획이 있는 사람에게는 Grok 4.2와 Gemini, 차세대 오픈AI 모델 경쟁이 매우 중요합니다. 수익형 대회에서의 성과는 "어떤 모델이 특정 환경에서 더 안정적으로 수익을 냈는가"라는 아주 실질적인 지표이기 때문입니다. 빠르게 수익 검증을 하고 싶은 입장이라면, 단순 인기보다 "실전에서 벌어들인 기록"을 우선 보는 것이 합리적입니다. 저라면 다음 1, 2년은 특정 회사에 올인하기보다, 최소 두 개 이상의 상위 모델을 병렬로 테스트하면서 수익·비용·리스크를 같이 비교하겠습니다.

반대로 일반 직장인 투자자 입장에서는 다른 전략이 필요합니다. 칩과 클라우드, 우주 데이터센터 같은 거대 인프라 게임은 대부분 개인이 직접 승부를 볼 수 있는 영역이 아닙니다. 뉴스가 화려하다고 섣불리 특정 반도체나 우주 관련 종목에 집중 투자하는 전략은 변동성 리스크가 지나치게 큽니다. 이 경우에는 "AI 투자"를 개별 종목이 아니라, 국내에서 실제로 AI 도입 속도가 빠른 산업과 기업을 추려보는 쪽이 현실적입니다. 예를 들어 반복 업무 자동화로 생산성을 올릴 수 있는 소프트웨어 회사, 콜센터와 고객 응대를 대규모로 운영하는 플랫폼, 데이터센터 부지와 전력 인프라를 가진 기업이 여기에 들어갈 수 있습니다.

지금 당장 할 수 있는 첫 행동

실무자든 투자자든, 지금 당장 할 수 있는 행동은 생각보다 단순합니다. 우선 사용하는 AI 모델을 하나만 두지 말고, 최소 두 세 가지 상위 모델을 같은 작업에 번갈아 써보는 것입니다. 번역, 코드 리뷰, 리서치, 글쓰기, 데이터 분석 같은 일상 업무에 직접 대입해서 "성능 대비 비용"과 "실수 패턴"을 비교해보면, 뉴스나 스펙시트에서 느끼지 못한 차이가 보입니다.

또 하나는 전력과 인프라 관점에서 뉴스를 보는 습관을 들이는 것입니다. TPU 판매, GPU 재고, 우주 데이터센터가 등장할 때마다 "어떤 지역의 전력 수요가 늘어날까, 국내에서는 어느 산업이 영향을 받을까"라는 질문을 던지면, 막연한 AI 붐이 아니라 구체적인 투자와 커리어 전략으로 이어질 수 있습니다. 결국 이 거대한 AI 전쟁에서 개개인이 취할 수 있는 최선의 태도는, 특정 회사의 팬이 되는 것이 아니라 "어디서 실제 현금 흐름이 생기고, 어디서 과열이 일어나는지"를 꾸준히 관찰하는 냉정함입니다.


출처 및 참고 :

이 노트는 요약·비평·학습 목적으로 작성되었습니다. 저작권 문의가 있으시면 에서 알려주세요.