GPT-3에서 Gemini 3까지 3년, AI는 어떻게 '동료'가 되었나
2022년 말, 우리는 챗GPT가 써 준 짧은 시와 농담에 열광하던 시기를 지나고 있었습니다. 이제 3년이 채 안 지난 2025년, 같은 계열의 기술이 우리 대신 연구 데이터를 정리하고, 웹사이트를 만들고, 통계를 돌리고, 심지어 "논문 초안"까지 뚝딱 써 주는 시대가 되었죠.
이 글에서는 구글의 새로운 AI 모델인 Gemini 3를 중심으로, 불과 몇 년 만에 AI가 어떻게 '대화형 장난감'에서 '디지털 동료'로 진화했는지, 그리고 그 변화가 우리 일·공부·업무 방식에 어떤 의미를 갖는지 현실적인 관점에서 풀어보려 합니다.
3년 전엔 '시 쓰는 챗봇', 지금은 '게임 만드는 엔진'
처음 챗GPT가 등장했을 때 사람들이 가장 놀란 건, "말이 통한다"는 감각이었습니다. 말을 알아듣고, 문장을 매끄럽게 이어 나가고, "수달에게서 도망치는 사탕 동력 초광속 엔진" 같은 이상한 주제를 시나 글로 만들어내는 것만으로도 충분히 충격이었죠.
하지만 Gemini 3를 실제로 써보면, 이제 놀라움의 기준이 완전히 달라졌다는 걸 깨닫게 됩니다. 단지 "설명하는 능력"이 아니라 "직접 만들어버리는 능력"이 중심으로 올라왔기 때문입니다.
예를 들어, 예전엔 AI에게 "사탕으로 움직이는 우주선 엔진을 상상해서 설명해줘"라고 했을 때, 그럴듯한 문장과 설정을 써주는 것이 전부였습니다. 하지만 Gemini 3에게는 같은 컨셉을 던졌을 때, 아예 "사탕 동력 FTL(초광속) 우주선 시뮬레이터"라는 작은 게임을 직접 만들어 줍니다. 코드로 엔진을 구현하고, 인터페이스를 설계하고, 플레이어가 조작할 수 있는 형태로 구현해 버리는 거죠.
즉, 2022년엔 "엔진을 묘사하는 글"을 쓰던 AI가, 2025년에는 "엔진을 실제로 코딩하고, 작동하는 것"까지 해 내고 있습니다. AI의 중심 능력이 '글쓰기'에서 '만들기'로 옮겨가고 있다는 점이 핵심입니다.
코딩을 넘어서: Antigravity와 '무엇이든 대신 해주는' 도구들
Gemini 3와 함께 공개된 도구 중 하나가 'Antigravity'입니다. 표면적으로 보면 개발자를 위한 코드 도우미처럼 보입니다. 하지만 조금만 들여다보면, 이건 사실 "프로그래머만을 위한 도구"가 아니라 "컴퓨터로 할 수 있는 거의 모든 일을 대신 해주는 도구"에 가깝습니다.
핵심 아이디어는 아주 단순합니다. 우리가 컴퓨터에서 하는 모든 일은 결국 코드로 표현될 수 있습니다. 엑셀 보고서 만들기, 파워포인트 디자인, 웹사이트 제작, 파일 정리, 데이터 분석, 심지어 브라우저 조작까지요.
그렇다면 "코딩을 잘하는 AI"는 곧 "컴퓨터로 할 수 있는 일을 거의 다 대신 해줄 수 있는 AI"가 됩니다. Antigravity는 이 지점을 적극적으로 밀어붙입니다.
사용자는 코드로 명령하지 않습니다. 그냥 자연어로 말하듯이 요청합니다.
"내가 그동안 쓴 AI 관련 예측 글들을 모아서 보기 좋게 정리해줘. 웹에서 찾아보고, 어느 부분이 맞았고 틀렸는지도 체크해줘."
그러면 Gemini 3는 사용자가 지정한 폴더 안의 문서들을 분석하고, 필요한 코드들을 스스로 작성해 실행합니다. 그 과정에서 계획을 세우고, 웹 리서치를 진행하고, 사이트를 만들고, 브라우저를 열어 결과물을 직접 확인합니다. 중간 중간에 "이렇게 진행해도 될까요?"라며 승인을 요청하고, 사용자는 사람에게 피드백 주듯 방향만 잡아주면 됩니다.
중요한 건, 이 모든 과정이 "챗창에 몇 줄 쳐 넣는 수준"이 아니라, 실제 작업자가 할 법한 워크플로 전체를 대신 수행하는 단계까지 와 있다는 점입니다. AI가 코드를 짤 줄 안다는 건, 단순히 개발자의 생산성을 높이는 수준이 아니라, 컴퓨터를 다루는 거의 모든 지식 노동에 개입할 수 있다는 뜻이 됩니다.
AI에 디렉터를 붙이다: '챗봇'에서 '팀원 관리'로
Gemini 3와 Antigravity를 써보면, 기존의 "프롬프트 넣고, 답변 받는 챗봇"과는 느낌이 완전히 다릅니다. 대화 상대라기보다, 일을 맡길 수 있는 "주니어 팀원"에 가깝습니다.
AI에게 디렉터가 필요한 이유는 간단합니다. 지금의 AI는 생각보다 많이 할 수 있지만, 여전히 "완벽하게 알아서 다 해주는 존재"는 아니기 때문입니다.
AI 에이전트에게 프로젝트를 맡기면, 중간에 여러 번 체크인이 들어옵니다. "이 방향으로 정리해도 될까요?" "이 기준으로 그룹을 나누어 분석해 볼까요?" "사이트 디자인은 이런 스타일로 가도 괜찮나요?"
우리는 그때마다 승인하거나, 조금 수정하거나, "이 부분은 이렇게 바꿔줘" 정도의 피드백을 줍니다. 이 과정은 기존의 챗봇처럼 "계속 프롬프트로 조율하는" 느낌이 아니라, 진짜 사람을 관리하는 감각과 꽤 비슷합니다.
더 흥미로운 점은, AI가 저지르는 실수가 이제 예전과 조금 다르다는 것입니다. 단순한 '환각(hallucination)'이라기보다, "판단이 애매한 부분에서 인간과 의견이 갈리는 지점"에 가까운 경우가 많습니다. 예를 들어 표현의 톤, 이론을 얼마나 과감하게 확장할지, 어떤 분석 방법을 우선시할지 같은 부분들이죠.
그래서 인간의 역할도 미묘하게 바뀝니다. 예전에는 "AI가 틀린 사실을 말하면 잡아내는 검수자"였다면, 이제는 "AI에게 일을 분배하고, 방향을 제시하고, 품질 기준을 정해주는 감독자"에 가깝습니다.
요약하자면, 챗봇 시대의 프롬프트는 "질문하기"였다면, 에이전트 시대의 프롬프트는 "업무 지시서 쓰기"에 더 가까워졌습니다.
Gemini 3는 정말 '박사급 지능'일까?
AI 업계에서 자주 등장하는 말 중 하나가 "PhD 레벨 인텔리전스"입니다. 듣기에 멋진 표현이지만, 실제로 어느 정도 수준을 의미하는지 감이 잘 안 오죠. 그래서 한 가지 흥미로운 실험이 진행되었습니다.
먼저, 10년 전쯤의 연구 프로젝트 폴더를 통째로 Gemini 3에게 맡겼습니다. 파일 이름은 "project_final_seriously_this_time_done.xls" 같은, 연구자라면 한 번쯤 봤을 법한 혼란스러운 구조. 심지어 오래된 통계 프로그램(STATA) 형식과 깨진 데이터도 섞여 있었습니다.
지시는 딱 하나였습니다. "이 데이터 구조를 이해하고, STATA 파일을 정리해서 새로운 분석이 가능하도록 준비해줘."
Gemini 3는 데이터 형식을 파악하고, 깨진 부분을 복구하고, 분석 가능한 형태로 정리해냈습니다. 그다음에는 한 단계 더 어려운 미션이 주어졌습니다.
"좋아, 이제 이 데이터를 가지고 새로운 논문을 하나 써줘. 크라우드펀딩 자체만이 아니라, 기업가정신 혹은 경영전략 분야에서 의미 있는 이론적 주제와 연결해. 선행연구를 조사하고, 가설을 세우고, 통계 분석을 하고, 학술지에 투고할 수준의 형식으로 작성해줘."
이 정도면 실제 2~3년 차 박사과정 학생에게 줄 법한 과제에 가깝습니다. Gemini 3는 스스로 주제를 선택하고, 관련 이론을 찾아보고, 가설을 설정하고, 코드를 짜서 데이터를 분석하고, 그 결과를 바탕으로 10여 페이지가 넘는 논문 초안을 만들어 냈습니다.
특히 인상적인 부분은, 데이터 안에 있는 아이디어를 찾아내는 방식이었습니다. 예를 들어 "크라우드펀딩 프로젝트 아이디어가 얼마나 독창적인지"를 텍스트 유사도 기반으로 계량화하는 새로운 지표를 직접 설계하고, 그걸 활용해 분석을 진행한 것입니다.
물론 완벽하진 않았습니다. 통계 기법 선택이 최선이 아닌 부분도 있었고, 이론적 해석이 다소 과감한 부분도 눈에 띄었습니다. 하지만 이건 "AI라서 틀리는" 느낌이 아니라, 실제 사람 대학원생에게도 충분히 할 법한 실수들이었습니다.
더 흥미로운 건, 피드백을 줬을 때의 반응입니다. "크라우드펀딩 선행연구를 더 많이 정리해서, 방법론 기반을 좀 더 탄탄하게 다져줘." 이런 식으로 비교적 포괄적인 코멘트를 주면, Gemini 3는 그 방향을 이해하고 논문을 눈에 띄게 보강했습니다.
결론적으로 말하자면, Gemini 3는 "완성된 박사"까지는 아니지만, "꽤 유능한 박사과정생" 정도의 작업은 이미 수행 가능한 지점에 근접해 있습니다. 이제 논의의 초점은 "AI가 할 수 있냐 없냐"가 아니라, "얼마나 좋은 지도를 해주면, 인간 연구자와 함께 어느 수준까지 끌어올릴 수 있느냐"로 옮겨가고 있습니다.
챗봇에서 디지털 동료로: 우리가 준비해야 할 변화
Gemini 3의 등장은 단순히 "새로운 모델이 나왔다"는 수준을 넘어서, 몇 가지 중요한 신호를 줍니다.
첫째, AI의 성장은 아직 눈에 띄게 둔화되지 않았습니다. GPT-3에서 챗GPT, 그리고 Gemini 3에 이르기까지, 3년 사이에 "짧은 글 잘 쓰는 챗봇"에서 "복잡한 프로젝트를 수행하는 실행형 에이전트"로 흐름이 이동했습니다.
둘째, 에이전트형 모델의 시대가 본격적으로 열리고 있습니다. 이제 AI는 텍스트를 생성하는 도구를 넘어서, 브라우저를 열고, 파일을 읽고, 코드를 실행하고, 프로젝트 단위의 작업을 수행하는 존재로 자리 잡고 있습니다.
셋째, 인간의 역할이 재정의되고 있습니다. 과거에는 "AI의 실수를 잡아내는 사람"이 중요했다면, 앞으로는 "AI에게 일을 잘 시키고, 목표를 정의하고, 적절히 관리하는 사람"이 훨씬 중요해질 겁니다. 즉, AI와 함께 일하는 능력 자체가 하나의 핵심 역량이 되는 것이죠.
물론, 아직 해결해야 할 과제도 많습니다. AI에게 컴퓨터 접근 권한을 주는 건 보안·프라이버시 측면에서 상당히 위험할 수 있고, 비전문가가 안심하고 쓸 수 있도록 설계된 안전장치도 더 필요합니다. 또한, 교육·직장·연구 현장에서 "이 강력한 도구를 어디까지, 어떻게 허용하고, 어떤 기준으로 평가할 것인가"에 대한 사회적 합의도 따라와야 합니다.
그럼에도 불구하고 한 가지는 분명해 보입니다. 우리가 챗GPT에 시를 지어보라고 하며 신기해하던 시절에서, 에이전트에게 "이 데이터로 새로운 논문을 써봐"라고 지시하고 결과를 토론하는 시대로 이동하는 데 걸린 시간은 1,000일도 되지 않았다는 사실입니다.
이제 중요한 질문은 이것입니다. "AI가 우리 일을 빼앗을까?"가 아니라, "AI와 함께 일할 때, 나는 어떤 역할을 할 것인가?"입니다.
앞으로는 프롬프트를 잘 쓰는 능력뿐 아니라, – 문제를 명확히 정의하고 – 작업 단계를 설계하고 – 피드백을 통해 결과물을 개선시키는 일종의 'AI 매니지먼트 스킬'이 점점 더 중요해질 것입니다.
우리가 해야 할 일은, 이 새로운 "디지털 동료"를 두려워하기보다, 어떻게 하면 이들을 잘 이끌어 더 큰 성과를 낼 수 있을지, 지금부터 차근차근 연습해 보는 것 아닐까요?
출처 및 참고 : Three Years from GPT-3 to Gemini 3 - by Ethan Mollick
이 노트는 요약·비평·학습 목적으로 작성되었습니다. 저작권 문의가 있으시면 에서 알려주세요.
