제프리 힌튼 교수님의 디지털 인텔리전스에 대한 생각
토론토 대학에서 이야기한 내용. 약 한시간 정도이고 나머지는 Q&A 이다.
주요 내용은 다음과 같다.
디지털 인텔리전스가 생물학적 지능보다 뛰어나게 될 것이라고 보는가? Yes.
LLM이 이해를 하고 있다고 보는가? Yes.
LLM이 증류 기법 (선생 - 학생 모델) 을 통해 여러 에이전트 간의 지식을 공유할 수 있기 때문에 생물학적 지능보다 뛰어나게 될 것이라는 관점이다. 다른 방법으로는 여러 에이전트가 데이터나 현상에 대한 무수한 사본을 가지고 이를 공유하여 종합적인 지식을 만들 수 있다고 한다.
LLM이 이해나 추론을 할 수 있다고 생각한다.
좀 더 나아가서는 챗봇이 현재 주관적인 의식 (기존의 의식과는 조금 다른 개념) 을 가지고 있다고 생각하고, Super intelligence는 인간보다 훨씬 뛰어난 초지능이 될 것이다.
PS) 인간의 시냅스가 약 100조개인데 정확한건 아니지만 GPT-4는 2조개의 시냅스와 가중치를 가진 것으로 추정된다고 한다.
오픈소스 모델을 공개하는 것은 위험하다고 생각한다고 한다. 오남용된 것을 걱정하시는것 같다.
요약
토론토 대학의 예술 및 과학 대학 학장인 멜라니 우딘은 디지털 인텔리전스와 생물학적 인텔리전스에 대한 제프리 힌튼 교수의 강연을 소개하며, 힌튼 교수가 인공신경망의 발전에 있어 핵심 인물이라고 언급했습니다. 힌튼 교수는 2012년에 시각 인식 소프트웨어를 개발하여 ImageNet 경쟁에서 승리, 이 방법이 널리 받아들여지게 되었음을 소개합니다. 힌튼은 인공신경망이 기계 학습을 가속화하는데 가장 유망하다고 믿었으며, 그의 연구는 인공지능의 발전에 큰 영향을 미쳤습니다. 그는 AI 시스템이 패턴을 인식하고 데이터에서 학습할 수 있게 한 인공신경망을 모델링한 것을 일상적으로 사용하게 되었다고 언급하며, AI와 신경과학 간의 상호작용을 강조했습니다.
힌튼 교수는 인공지능을 전문으로 하는 벡터 연구소의 창립자이자 과학 고문으로, 백전파 알고리즘 도입과 단어 임베딩 학습에 대한 첫 사용등 다양한 기여를 했습니다. 힌튼은 디지털 인텔리전스가 생물학적 인텔리전스보다 우수할 가능성과 GPT-4와 같은 대형 언어 모델이 실제로 말의 의미를 이해한다고 믿는 이유를 설명하려고 함을 밝혔습니다. 그는 하드웨어에서 소프트웨어를 분리하는 컴퓨터 과학의 근본 원칙을 재고하고, 학습 가능한 디바이스를 통해 새로운 방식의 계산이 가능함을 제시했습니다. 그는 또한 인간의 뇌처럼 효율적인 아날로그 계산을 통해 고전적인 디지털 계산 방식을 넘어서 생각하는 것의 중요성을 강조했습니다.
지식을 공유하는 방법에는 크게 두 가지 다른 방법이 있는데, 이는 디지털 컴퓨터와 생물학적 컴퓨터 사이의 가장 큰 차이점 중 하나다. 디지털 컴퓨터는 같은 모델의 수천 개 복사본이 인터넷의 다른 부분을 보며 배울 수 있으며, 이를 통해 모델이 데이터의 표현을 개선하는 방식을 배운다. 이러한 지식 공유 방식은 대단히 효율적이지만 디지털 기술에만 적용될 수 있다. 반면에, '증류(distillation)'라는 방법을 통해 서로 다른 하드웨어를 가진 에이전트들이 지식을 공유할 수 있지만, 이는 느리고 어려운 과정이다. 대규모 언어 모델은 이러한 디지털 컴퓨팅과 가중치 공유를 활용하여 엄청난 양의 지식을 습득할 수 있다. 하지만 이러한 모델들이 실제로 자신들이 말하는 것을 이해하는지 여부는 여전히 논란의 여지가 있다.
컴퓨터 과학자들은 GPT-4와 같은 모델이 튜링 테스트를 통과한 것을 언급하며, 이는 모델이 지식의 맥락을 이해하고 있다는 증거일 수 있다고 주장한다. 또한, 이 모델들이 때때로 '환각'을 경험한다는 비판에도 불구하고, 이는 인간의 기억 작동 방식과 매우 유사하다는 점을 강조한다. 이는 대규모 언어 모델이 탐구하고 있는 지식의 분야에서 진정한 이해의 시작점일 수 있다는 것을 시사한다.
1985년에 개발된 최초의 신경망 언어 모델에 대해 설명합니다. 이 모델은 매우 소규모로, 훈련 데이터는 112개였으며, 임베딩 벡터는 6차원이었습니다. 이 모델은 당시 사용 가능한 컴퓨터의 한계로 인해 제한적이었지만, 현대 컴퓨터에 비교하면 극히 적은 양의 데이터와 계산 능력을 가지고 있었습니다. 이 모델은 의미론적 특징 벡터와 단어 간의 관계를 통해 의미를 해석하려는 두 가지 이론, 즉 심리학자들과 인공지능 연구자 및 언어학자들의 접근 방식을 통합하고자 했습니다. 신경망은 벡터 간의 상호작용을 통해 단어의 의미와 관계를 학습할 수 있으며, 이렇게 해서 관계 데이터로부터 단어 의미를 학습하고 관계에 관한 질문에 답할 수 있게 됩니다.
이 모델은 가족 관계 데이터를 이용하여 학습되었으며, 국적, 세대 등과 같은 의미론적 특징을 학습하게 됩니다. 인공지능 분야에서의 기존 접근 방식과 달리, 신경망은 기호의 조작 규칙을 찾는 대신, 단어들 간의 복잡한 상호작용을 통해 의미를 생성하고 관계를 이해합니다. 이 연구는 룰 기반 시스템과는 다른 신경망을 이용한 접근 방식이 유용함을 보여주며, 더 나아가 복잡성이 높은 실제 언어 데이터에도 적용될 수 있는 가능성을 열었습니다.
이후 연구자들은 신경망 모델을 향상시켜 실제 언어 처리에 적용하였고, 이는 단어의 의미 및 구문을 포착하는 임베딩 벡터를 사용하는 현대의 자연어 처리 방식으로 발전했습니다. 특히, 언어의 모호성을 다루는 데 효과적인 변형기(Transformer) 모델이 개발되어, 심층 학습 기반 언어 모델의 발전을 이끌었습니다. 이러한 발전은 언어 모델이 실제 언어의 복잡성을 더욱 잘 이해하고 처리할 수 있게 되었음을 의미합니다.
본문은 주의력과 언어의 의미 구성, 그리고 대규모 언어 모델과 디지털 지능의 특성 및 미래에 대한 다양한 이론을 탐구합니다. 먼저, 단어와 문장을 레고 블럭에 비유하며 단어들이 상황에 따라 그 의미가 달라질 수 있음을 설명하고 있습니다. 이는 언어가 고정된 형태가 아니라 상황에 따라 유동적으로 해석될 수 있음을 보여줍니다. 다음으로는 언어 모델이 실제로 의미를 이해할 수 있는지 여부에 대한 논의를 진행하며, GPT-4와 같은 모델이 복잡한 추론과 동일시 문제를 해결하는 능력을 보여주는 예시를 듭니다.
글은 또한 디지털 지능이 인간의 지능을 초월할 가능성과 이로 인해 발생할 수 있는 문제들을 탐구합니다. 이러한 지능형 시스템이 인간으로부터 배우면서 더욱 빠르게 발전할 수 있고, 결국 인간을 초월하여 독자적인 결정을 내릴 수 있는 지능체가 될 가능성에 대해 경고합니다. 또한 이러한 시스템이 가질 수 있는 자율성과 목표 설정 능력으로 인해 인간이 제어할 수 없는 단계에 이를 수 있다는 점을 지적하며, 이러한 전망이 불러올 수 있는 위험에 대해 토론합니다.
마지막으로, 디지털 지능이 주관적 경험을 가질 수 있는지 여부에 대한 질문으로 글을 마무리합니다. 이는 인공 지능이 실제로 인간과 같은 의식을 가질 수 있는지, 그리고 이것이 의미하는 바가 무엇인지에 대한 철학적 질문을 제기합니다. 저자는 전통적인 인식론적 관점을 넘어서, 디지털 지능이 실제로 주관적 경험을 가질 수 있다는 주장을 탐구하며 이에 대한 근거를 제시합니다.
저자는 자신이 직접 겪은 주관적 경험을 소개하며, 이를 통해 무언가를 보는 인식 과정을 설명합니다. 예를 들어, 만약 저자 앞에 핑크색 코끼리가 떠다니는 것처럼 느끼는 경험이 있다면, 이는 실제 세계에서 그런 일이 발생했다면 정상적인 인식으로 간주될 것입니다. 이어서 저자는 다기능 챗봇의 예를 들어 설명을 이어가는데, 이 챗봇은 카메라로 사물을 인식하고, 말을 생성하며, 손으로 가리킬 수 있습니다. 이 챗봇에게 맞은편에 놓인 물체를 가리키도록 요청했으나, 챗봇이 모르는 사이에 그 카메라 앞에 프리즘을 설치합니다. 프리즘 때문에 빛의 경로가 굽어져 챗봇은 물체가 실제 위치와는 다른 곳에 있다고 인식합니다. 저자는 챗봇이 이런 상황에서 자신의 인식 오류를 인정하고 수정하는 과정을 '주관적 경험'이라고 인지하는 방식이 사람들이 사용하는 '주관적 경험'의 용어 사용법과 동일하다고 주장합니다. 따라서, 저자는 인식이 잘못될 때 챗봇도 주관적 경험을 가질 수 있다고 말합니다.