딥마인드의 David Silver가 떠난 이유: LLM만으론 초지능이 부족한가
요즘 AI 이야기는 거의 “LLM(대형 언어 모델) = 미래”로 흘러갑니다. 그런데 알파고(AlphaGo) 신화를 만든 핵심 인물 중 한 명인 David Silver가 구글 딥마인드를 떠나, 런던에서 새 AI 스타트업을 꾸리며 “LLM만으로는 초지능(superintelligence)에 닿기 어렵다”는 쪽에 무게를 실었습니다1.
이 글은 Silver가 왜 ‘말 잘하는 AI’ 대신 ‘경험으로 배우는 AI’에 베팅하는지, 그리고 그 흐름이 업계 전체의 고민(트랜스포머 이후, 다음 한 수는?)과 어떻게 맞물리는지 한 번에 정리해드립니다.
David Silver의 퇴사와 스타트업 ‘Ineffable Intelligence’의 의미
David Silver는 딥마인드 초창기 멤버로, AlphaGo·AlphaZero·MuZero 같은 강화 학습 기반 프로젝트의 중심에 있던 연구자입니다. 그런 그가 최근 딥마인드를 떠나 ‘Ineffable Intelligence’라는 회사를 런던에 설립했습니다1.
이 장면이 상징적인 이유는 단순 이직이 아니라 “초지능으로 가는 길”에 대한 노선 변경 선언에 가깝기 때문입니다. 지금까지 주류는 텍스트를 잔뜩 먹여서 더 그럴듯한 답을 만드는 방향(스케일링)이었다면, Silver는 애초에 “답을 잘 말하는 것”과 “세상을 잘 푸는 것”은 다를 수 있다고 보는 쪽입니다.
“LLM은 인간 지식의 요약본”이라는 한계
LLM은 인터넷에 존재하는 방대한 텍스트를 학습해, 인간이 남긴 지식을 압축하고 재조합하는 데 특화돼 있습니다. 그래서 말도 잘하고, 요약도 잘하고, 코드도 곧잘 짭니다.
하지만 Silver가 지적하는 포인트는 여기서 한 발 더 들어갑니다. 인간이 이미 정리해둔 텍스트의 울타리 안에서는 똑똑해 보일 수 있어도, 완전히 새로운 문제를 ‘스스로 정의하고’ ‘경험으로 검증하며’ ‘지식을 생성’하는 단계로 가면 얘기가 달라진다는 거죠. 초지능이 목표라면, “인간의 정답 노트를 외운 학생”이 아니라 “실험하고 실패하면서 교과서를 새로 쓰는 연구자”에 가까워야 한다는 주장입니다.
강화 학습(Reinforcement Learning)이 다시 주목받는 이유
강화 학습은 한마디로 “해보고, 망해보고, 또 해보면서 점점 나아지는” 방식입니다. 바둑에서 한 수 잘못 두면 바로 패배로 돌아오듯, 결과가 명확한 환경에서 특히 강력하죠. AlphaGo 계열이 그랬고, MuZero는 규칙(모델)을 몰라도 스스로 내부 세계를 만들어가며 성능을 끌어올리는 방향을 보여줬습니다.
Silver의 스타트업이 노리는 것도 이 지점입니다. 텍스트로 ‘설명된’ 지식을 주입하기보다, 시스템이 직접 환경과 상호작용하며 “왜 그런지”를 자기 경험으로 체득하게 만들겠다는 겁니다. 한마디로, 초지능을 “검색+요약”이 아니라 “경험+발견”에서 찾겠다는 베팅입니다.
‘경험의 시대’ 선언: Sutton과의 문제의식이 만난 지점
Silver는 강화 학습의 거장 Richard Sutton과 함께 쓴 논문에서, AI 개발 패러다임을 ‘경험의 시대’로 옮겨야 한다고 주장한 바 있습니다. 핵심은 간단합니다. 많이 아는 AI가 아니라, 계속 배우는 AI가 필요하다는 것.
실제 인간 지능도 한 번 공부하고 끝이 아니라, 매 순간 세계와 부딪히며 업데이트됩니다. 그런데 많은 LLM은 특정 시점의 데이터로 한 번 크게 학습된 뒤, 세계가 바뀌어도 “아는 척은 하지만 몸으로는 못 배우는” 상태가 되기 쉽습니다. Silver가 말하는 ‘끊임없이 학습하는 초지능’은 이 약점을 정면으로 겨냥합니다.
트랜스포머만으로는 부족하다는 업계의 불안과 ‘다음 수’ 경쟁
최근 다보스(WEF)에서도 “LLM이 인간 수준 지능으로 가는 길이냐”를 두고 업계 스타들이 정면으로 부딪혔습니다. 딥마인드의 Demis Hassabis는 “지금 시스템은 인간 수준 AGI와는 거리가 있다”고 선을 그었고, Yann LeCun은 더 강하게 “LLM만으로는 인간 같은 지능에 못 간다”는 취지로 말했습니다2.
이 논쟁이 중요한 이유는, 단지 학술 취향 싸움이 아니라 투자·인재·제품 방향이 걸린 문제이기 때문입니다. 지금의 트랜스포머(Transformer) 중심 접근이 언젠가 ‘천장’을 만날 수 있다는 우려가 커지면서, 세계 모델(world model), 에이전트, 강화 학습, 멀티모달 환경 학습 같은 “포스트-LLM” 실험이 스타트업에서 더 활발해지는 흐름이 생겼습니다. Silver의 창업은 그 흐름을 대표하는 장면 중 하나입니다.
시사점은 명확합니다. ‘말하는 AI’의 시대는 이미 열렸고, 이제 경쟁은 ‘살아있는 AI(경험하고 적응하는 AI)’로 넘어갈 가능성이 큽니다.
초지능을 당장 체감하는 독자 입장에서는 이렇게 정리하면 실용적입니다. LLM은 업무 자동화와 생산성에 계속 강해질 겁니다. 하지만 “스스로 목표를 세우고, 장기 계획을 세우고, 실패를 자산으로 바꾸는” AI는 다른 게임입니다. 만약 여러분이 AI를 도입하거나 커리어를 설계한다면, 프롬프트 스킬만이 아니라 에이전트, 강화 학습, 시뮬레이션 환경, 지속 학습 같은 키워드에도 관심을 넓혀두는 편이 안전합니다.
그리고 Silver의 선택은 이런 메시지를 던집니다. “초지능으로 가는 길은, 더 많은 텍스트가 아니라 더 많은 경험일지도 모른다.”
참고
1Exclusive: Longtime Google DeepMind researcher David Silver leaves to found his own AI startup
2AI luminaries at Davos clash over how close human-level intelligence really is