연구에 따르면 LLMs는 AI 에이전트 훈련을 위한 세계 모델로 활용될 수 있습니다.
- 새로운 연구에 따르면 대형 언어 모델(LLMs)이 환경을 시뮬레이션할 수 있는 능력을 강화함으로써, 자율 AI 에이전트의 훈련 장애물을 해결할 수 있는 잠재적인 솔루션을 제시할 수 있음.
- AI 에이전트는 실제 환경과 상호작용하여 학습해야 하나, 실제 환경은 한정적이며 확장이 어려움.
- 중국 남과학기술대학교, 마이크로소프트 리서치, 프린스턴 대학교, 에든버러 대학교 등을 포함한 연구팀은 LLMs가 세계 모델(world models)로 작동할 수 있는지 시험.
- 세계 모델은 에이전트가 특정 행동을 취할 때 발생하는 상황을 예측하고, 이를 통해 에이전트가 실제 환경 대신 시뮬레이션 안에서 훈련할 수 있게 함.
- 연구는 언어 모델링을 재구성하여, 다음 단어가 아닌 행동 후 환경의 다음 상태를 예측하도록 하여, LLMs가 실제 상호작용에 덜 의지하며 훈련 가능하도록 함.
- 실험은 다섯 가지 텍스트 기반 환경에서 실행되었으며, 각각의 시뮬레이션 결과 높은 정확성을 보임.
- Qwen2.5-7B와 Llama-3.1-8B 모델은 특정 환경에서 99% 이상의 예측 정확도를 보여, 정밀 튜닝이 고정밀 환경 시뮬레이션에 유용함을 입증.
- 데이터 양과 모델의 크기가 환경 시뮬레이션 성능에 중요한 요소로 작용하며, 환경의 복잡성이 커질수록 이 두 요소의 확장이 필요.
- 이 연구는 LLMs가 환경 동역학을 시뮬레이션할 수 있음을 보여주며, 경험 기반 AI 훈련의 잠재적 기반을 마련.
- 하지만 끊임없는 학습과 잊지 않는 연속적 학습의 부족 문제는 여전히 해결되지 않은 과제로 남아 있음.
5the-decoder.com링크 복사하기
AI 뉴스 요약은 뉴스의 내용을 AI가 요약 한 것입니다. 따라서 틀린 내용을 포함할 수 있습니다. 뉴스의 자세한 내용을 확인하시려면 해당 뉴스 링크를 클릭해주세요.
