영국 ARIA가 밀어주는 ‘AI 과학자’…실험까지 스스로 한다고?
“AI가 논문 요약해주는 시대”는 이제 익숙하죠. 그런데 영국 정부는 한 걸음 더 나아가, AI가 가설을 세우고 실험을 설계한 뒤 실제로 실행하고 결과까지 분석하는, 말 그대로 ‘AI 과학자(AI Scientist)’를 지원하기 시작했습니다. 이번 글에서는 영국 ARIA가 왜 이런 도전에 돈을 거는지, 어떤 팀이 뽑혔는지, 그리고 ‘AI가 연구를 자동화한다’는 말이 어디까지 가능한지(한계는 뭔지)까지 한 번에 정리해볼게요.
ARIA란? “실패해도 괜찮아”를 제도화한 조직
ARIA(Advanced Research and Invention Agency)는 영국 정부가 만든 고위험·고보상 연구를 위한 전담 기관입니다. 큰 그림은 미국 DARPA처럼 “될 수도, 안 될 수도 있는” 아이디어에 빠르게 베팅해 과학기술의 판을 바꿔보자는 쪽에 가깝습니다.
ARIA는 2023년 1월 공식 출범했고, 영국 과학혁신기술부(DSIT) 산하이지만 비교적 자율적으로 움직이는 구조로 설계됐습니다.1 이런 조직이 AI 과학자처럼 논쟁적이지만 잠재력이 큰 분야에 관심을 갖는 건 자연스러운 흐름이기도 합니다.
‘AI 과학자’는 챗봇이 아니라 실험 루프를 도는 시스템
ARIA가 말하는 AI 과학자는 단순히 “답변을 잘하는 모델”이 아닙니다. 가설을 만들고, 실험을 어떻게 할지 설계하고, 실험 장비나 소프트웨어를 통해 실행한 뒤, 결과를 해석하고, 그 결과를 다시 다음 실험에 반영하는 ‘반복 루프’를 핵심으로 봅니다.
쉽게 말해 연구실의 하루를 떠올려보세요. 오전엔 아이디어를 세우고, 오후엔 장비를 돌리고, 저녁엔 데이터 정리하다가 “아 이 조건을 바꿔야겠는데?” 하며 다음 실험을 예약하죠. AI 과학자는 이 과정을 ‘자동으로’ 계속 굴리는 쪽을 목표로 합니다. 연구자가 옆에서 계속 마우스를 잡고 지시하지 않아도요.
245개 제안서 중 12개 팀만…9개월짜리 ‘속도전’이 시작됐다
이번 지원은 경쟁이 치열했습니다. 총 245개 제안서가 들어왔고, ARIA는 그중 12개 팀을 선정했습니다. 선정된 팀들은 영국 절반, 미국·유럽 절반으로 구성됐고, 팀당 약 50만 파운드(약 67.5만 달러)를 받으며 연구 기간은 9개월입니다.
여기서 포인트는 “일단 여러 팀을 짧게 달리게 한다”는 운영 방식입니다. ARIA는 다양한 접근을 단기 지원으로 시험하면서, 과학 연구의 최전선이 실제로 어디로 움직이는지 감을 잡고, 그 결과를 바탕으로 더 큰 규모의 후속 투자를 위한 기준을 만들겠다는 의도를 밝혔습니다. 즉, 이번 라운드는 ‘예선전 겸 관찰 실험’에 가깝습니다.
어떤 AI가 뽑혔나: 나노·화학 로봇이 먼저 달린다
선정 팀들의 방향은 꽤 현실적입니다. 예를 들어 미국의 Lila Sciences는 양자점(quantum dots) 연구를 겨냥한 AI 나노-과학자 시스템을 개발합니다. 양자점은 디스플레이, 바이오 이미징 등에서 꾸준히 수요가 있는 영역이라 “자동 실험 루프”와 붙었을 때 성과가 눈에 띄기 쉬운 분야이기도 하죠.
영국 리버풀 대학교 팀은 비전-언어 모델(VLM)을 활용한 로봇 화학자를 개발하는데, 핵심은 실험 과정에서 생기는 오류를 ‘발견하고 해결’하는 능력에 초점이 맞춰져 있습니다. 화학 실험은 변수가 많고, 작은 실수 하나가 결과를 망치기 쉬워서 자동화 난이도가 높습니다. 그래서 오히려 “오류를 잡는 능력”이 실용성의 바로미터가 됩니다.
현실 체크: AI 에이전트는 아직 ‘끝까지’ 못 하는 경우가 많다
분위기만 보면 “이제 연구는 AI가 다 하겠네?” 싶은데, 브레이크도 필요합니다. 인도의 AI 연구소 Lossfunk가 최근 정리한 연구에 따르면, LLM 기반 에이전트 시스템이 과학 워크플로우를 처음부터 끝까지 완주하지 못하고 중간에 실패하는 사례가 다수 보고됐습니다. 즉, 계획은 그럴듯해도 실행 단계에서 막히거나, 도구 사용에서 실수하거나, 검증/재현성에서 흔들리는 일이 아직 흔하다는 뜻입니다.
ARIA도 비슷한 맥락을 짚습니다. 현재의 AI는 대개 기존 도구를 “잘 활용”하는 쪽이지, 연구에 필요한 완전히 새로운 도구를 뚝딱 만들어내는 단계까지는 아니라는 거죠. 다만 기술이 발전할수록 연구 속도를 크게 끌어올릴 가능성이 있으니, 지금부터 실험적으로 준비해두는 게 중요하다고 봅니다.
왜 지금 ‘AI가 실험하는 시대’를 국가가 밀어줄까?
이 흐름은 연구실 내부의 변화만이 아닙니다. 국가 차원에서 AI 인프라(데이터센터, 전력, 컴퓨트)를 얼마나 빨리 확보하느냐가 경쟁력이 되는 시대가 왔기 때문입니다. 영국은 AI “성장 구역(AI growth zones)”을 내세워 데이터센터 확충을 추진하고, 빅테크도 투자 계획을 내놓고 있지만, 전력망 연결 지연과 에너지 비용 같은 병목도 동시에 겪고 있다는 평가가 나옵니다.2
AI 과학자는 결국 “연구 자동화 + 대규모 컴퓨트 + 로봇/장비”가 합쳐진 종합전입니다. 그러니 정부 입장에선 소프트웨어만 잘 만든다고 끝이 아니라, 국가 인프라와 연결된 전략으로 보고 미리 판을 깔아두려는 움직임으로 읽힙니다.
시사점은 명확합니다. AI 과학자는 당장 모든 연구자를 대체한다기보다, 실험을 반복하는 구간(스크리닝, 조건 탐색, 오류 감지, 데이터 정리)을 빠르게 돌려 연구자 시간을 “아이디어와 해석”에 더 쓰게 만드는 쪽으로 먼저 힘을 낼 가능성이 큽니다.
개인적으로는, 이 분야를 볼 때 “AI가 똑똑해졌다”만 보지 말고 “AI가 실패했을 때 안전하게 멈추는가”, “재현 가능한 로그와 증거를 남기는가”, “전력/장비/데이터 접근 같은 현실 조건을 통과하는가”를 같이 봐야 한다고 생각합니다. ARIA가 여러 팀을 짧게 달리게 하는 방식은, 그 질문에 가장 빠르게 답을 얻는 실전형 실험이 될지도 모르겠네요.