Manus agent는 어떤 LLM 기반인가?
Manus AI의 LLM 기반 기술
Manus AI는 복잡하고 역동적인 광범위한 작업을 처리하도록 설계된 자율 AI 에이전트로, 여러 LLM 기술을 활용하고 있습니다. 검색 결과를 분석한 결과, Manus AI의 LLM 기반에 대한 중요한 정보를 확인할 수 있었습니다.
Manus AI의 기반 LLM 모델
Deedy Das의 LinkedIn 게시물에 따르면, Manus AI는 실행(execution)에는 Claude Sonnet 3.5를 사용하고, 계획(planning)에는 특별히 post-trained된 Qwen을 사용하는 것으로 언급되었습니다. 이는 Manus AI의 창업자인 Yichao가 직접 언급한 내용으로, Manus AI가 자체 LLM을 개발하기보다는 기존의 상용 LLM을 활용하고 있음을 시사합니다.
멀티 에이전트 아키텍처
Manus AI는 단일 LLM이 아닌 멀티 에이전트 아키텍처를 사용하고 있습니다. 이 시스템은 여러 독립적인 AI 모델로 구성되어 있으며, 각 에이전트가 협력하여 세분화된 작업을 체계적으로 처리합니다. 중국어 자료에 따르면, Manus AI는 Anthropic의 Computer Use와 유사한 방식으로 작동하며 완전히 독립적인 가상 머신에서 실행됩니다.
기술적 특성
Manus AI는 다음과 같은 기술적 특성을 가지고 있습니다:
멀티모달 상호작용: 텍스트, 이미지, 표, 실행 가능한 코드 등 다양한 유형의 데이터를 처리하고 생성할 수 있습니다.
외부 도구 통합: 웹 브라우저, 코드 편집기, 데이터베이스 관리 시스템 등 외부 도구와 통합되어 복잡한 작업을 수행할 수 있습니다.
비동기 클라우드 처리: 사용자의 기기가 오프라인 상태에서도 클라우드에서 비동기적으로 작업을 계속 실행할 수 있습니다.
메모리 기능: 과거 사용자 상호작용과 선호도를 기억하여 향후 작업 성능을 개선합니다.
DeepSeek 기술과의 연관성
일부 자료에서는 Manus AI가 DeepSeek R1 및 V3 모델과 같은 기술을 사용할 가능성이 언급되었습니다. DeepSeek의 모델들은 중국에서 개발된 고성능 AI 모델로, 특히 R1 모델은 추론 능력에 중점을 두고 있습니다. 그러나 이는 공식적으로 확인된 정보는 아닙니다.
Qwen 모델의 활용
Manus AI가 계획 단계에서 사용하는 것으로 언급된 post-trained Qwen 모델은 알리바바에서 개발한 LLM 제품군입니다. Qwen 모델은 최대 18조 개의 토큰으로 사전 훈련되었으며, 코딩, 수학, 지식 이해 등 다양한 능력을 갖추고 있습니다. 특히 Qwen2.5-Max는 20조 개 이상의 토큰으로 사전 훈련되고 SFT(Supervised Fine-Tuning)와 RLHF(Reinforcement Learning from Human Feedback) 방법론으로 추가 훈련되었습니다.
결론
Manus AI는 자체 LLM을 개발하기보다는 Claude Sonnet 3.5와 post-trained Qwen과 같은 기존 상용 LLM을 활용하는 멀티 에이전트 시스템입니다. 이 시스템은 다양한 AI 모델이 협력하여 복잡한 작업을 처리하는 아키텍처를 채택하고 있으며, 멀티모달 상호작용, 외부 도구 통합, 비동기 클라우드 처리, 메모리 기능 등의 특성을 갖추고 있습니다. DeepSeek R1 및 V3 모델과의 연관성도 언급되었지만, 이는 공식적으로 확인된 정보는 아닙니다.


