메인 콘텐츠로 건너뛰기

구글 딥마인드, 일주일 새 3건 거래…AI 인수 열풍의 이유

요약

요즘 AI 업계에서 “속도”는 곧 “생존”입니다. 구글 딥마인드가 바로 그 속도를 선택했습니다. 일주일 사이에 AI 스타트업 인수, 라이선스 계약, 투자까지 3건의 거래를 연달아 성사시키며 ‘공격 모드’에 들어갔죠. 이번 움직임을 한 문장으로 요약하면 이렇습니다. 딥마인드는 Gemini를 더 똑똑하게 만드는 것을 넘어, 더 “보고(3D)”, 더 “듣고(음성)”, 더 “발견하는(과학)” 쪽으로 판을 키우고 있습니다.

Google DeepMind 인수전 가속화, 왜 지금일까

겉으로는 “좋은 기술을 사 왔다”처럼 보이지만, 실제로는 제품 출시 속도를 끌어올리는 전술에 가깝습니다. 딥마인드 CEO 데미스 하사비스는 AI 경쟁이 매우 치열해졌고, 구글이 빠르게 제품을 내놓을 수 있도록 조직과 인프라를 다듬어 왔다고 밝힌 바 있습니다1.

즉, 연구 성과를 쌓는 것만으로는 부족하고, ‘바로 제품으로 연결되는 조각’을 외부에서 빠르게 가져오는 방식이 필요해진 거죠. 이번 3건의 거래는 그 조각들이 각각 다른 감각기관처럼 역할을 나눠 맡습니다. 눈(3D), 귀(감정 음성), 그리고 두뇌(과학 발견/차세대 아키텍처)입니다.

Common Sense Machines 인수: 2D를 3D로 바꾸는 ‘AI 눈’ 확보

첫 번째는 매사추세츠 기반의 Common Sense Machines 인수입니다. 이 회사는 2D 이미지를 3D 객체로 변환하는 AI 모델을 만들고, 약 12명 규모의 팀이 거래에 포함된 것으로 알려졌습니다. 과거 딥마인드 출신 테자스 쿨카르니가 공동 창업자라는 점도 눈길을 끕니다. 과거 평가액은 1,500만 달러로 언급됐지만, 인수 금액은 공개되지 않았습니다.

왜 3D가 중요할까요? 생성형 AI가 텍스트와 이미지를 “그려내는” 단계에서, 이제는 공간을 “이해하고 구성하는” 단계로 넘어가고 있기 때문입니다. 검색 결과의 이미지가 3D로 상품을 미리 배치해준다든지, 유튜브/게임/AR에서 장면을 즉석에서 입체로 재구성한다든지, 로봇이 카메라로 본 사물을 3D로 파악해 집어 든다든지—이런 시나리오의 출발점이 바로 2D→3D 변환 모델입니다.

딥마인드 입장에서는 “멀티모달(텍스트+이미지+영상) 다음은 3D”라는 흐름에 선제적으로 발을 담근 셈입니다.

Hume AI 라이선스 계약: 감정 인식 음성으로 Gemini ‘귀’ 강화

두 번째는 Hume AI와의 라이선스 계약입니다. 핵심은 인수가 아니라 “비독점적 권리”를 확보하는 형태라는 점입니다. 감정을 인식하는 음성 모델로 알려진 Hume AI의 특정 기술을 구글이 사용할 수 있게 되고, CEO 앨런 코웬과 약 7명의 엔지니어가 딥마인드로 합류해 Gemini의 음성 기능을 강화할 예정이라고 전해졌습니다2.

여기서 포인트는 “음성”이 아니라 “상황”입니다. 같은 문장도 목소리의 떨림, 속도, 강세에 따라 의미가 달라지죠. 감정 인식 음성 모델은 단순한 음성 인식(STT)보다 한 단계 위에서, 대화의 온도와 의도를 읽어내려는 시도입니다.

사용자 입장에서는 콜센터 자동화나 상담, 교육 튜터, 헬스케어 문진처럼 “사람이 예민해지는 순간”에 AI가 더 자연스럽게 개입할 가능성이 커집니다. 구글이 굳이 인수가 아니라 라이선스를 선택한 건, 빠르게 기능을 넣되 리스크와 락인을 분산시키는 실용적 선택으로도 읽힙니다.

Sakana AI 투자: ‘트랜스포머 이후’와 과학 발견을 동시에 노린다

세 번째는 일본 Sakana AI 투자입니다. Sakana AI는 2023년 설립된 이후 일본에서 가장 높은 평가를 받은 AI 스타트업으로, 평가액이 25억 달러로 거론됩니다. 공동 설립자인 데이비드 하와 리온 존스는 구글과의 인연이 깊은 인물들로 알려져 있습니다.

이 투자가 흥미로운 이유는 “두 갈래 목표”를 동시에 겨냥하기 때문입니다. 하나는 AI 기반 과학 발견 가속화입니다. Sakana AI는 구글의 AI 모델과 자사 기술을 결합해 과학 연구를 빠르게 돌리고, 보안 요구가 높은 금융기관·정부 기관을 염두에 둔 솔루션도 개발하려는 계획을 내세웁니다. 다른 하나는 트랜스포머(현 LLM의 주류 구조) 대안 연구입니다.

또한 자가 개선 AI 에이전트를 개발 중이며, Gemini 2.5 Pro로 구동되는 코드 에이전트가 코딩 대회에서 인간 상위 1,000명 중 21위를 기록했다는 내용도 함께 언급됩니다. 이 대목은 “모델 성능 경쟁”에서 “에이전트 실행력 경쟁”으로 무게중심이 이동하고 있음을 보여주는 신호로 볼 수 있습니다.

시사점: 구글의 ‘AI 쇼핑’은 기능이 아니라 시간을 산다

이번 딥마인드의 3연타 거래를 보면, 구글이 사고 있는 건 스타트업이 아니라 “시간”에 가깝습니다. 3D는 다음 인터페이스를 위한 시간, 감정 음성은 사용자 접점을 넓힐 시간, Sakana AI는 트랜스포머 이후를 대비할 시간 말이죠. 하사비스가 구글 CEO 순다 피차이와 거의 매일 전략을 논의한다고 밝힌 것도1, 이런 속도전 체제로 들어갔다는 신호로 읽힙니다.

실무적으로는 이렇게 정리해도 좋겠습니다. AI 트렌드를 따라가려면 모델 스펙만 보지 말고, “어느 감각(3D·음성·에이전트)에서 제품화가 빨라지는가”를 보세요. 그리고 그 변화는 대체로 대기업의 인수·투자 뉴스에서 먼저 티가 납니다. 결국 시장은 기술보다 빠른 출시와 안정적인 통합에 보상을 주니까요.

참고

1DeepMind, Google CEOs talk 'every day' amid 'ferocious' AI competition

2Google Nabs Top Talent From AI Voice Startup Hume AI | WIRED

#구글 딥마인드#스타트업 인수#3D 생성 AI#감정 인식 음성#AI 에이전트

이 노트는 요약·비평·학습 목적으로 작성되었습니다. 저작권 문의가 있으시면 에서 알려주세요.

Tilnote 를 사용해 보세요.

키워드만 입력하면 나만의 학습 노트가 완성돼요.

책이나 강의 없이, AI로 위키 노트를 바로 만들어서 읽으세요.

콘텐츠를 만들 때도 사용해 보세요. AI가 리서치, 정리, 이미지까지 초안을 바로 만들어 드려요.