Alibaba의 QwQ 모델은 향상된 추론 능력으로 OpenAI o1에 도전한다

2024-11-28

제목: "알리바바의 QwQ 모델, 강화된 추론 능력으로 OpenAI o1에 도전"
알리바바는 논리적 추론과 문제 해결 능력에 중점을 둔 새로운 AI 모델 QwQ-32B-Preview를 출시함.
이 모델은 일부 영역에서 OpenAI의 최신 모델보다 뛰어난 성능을 보임.
QwQ-32B-Preview는 325억 개의 파라미터를 포함하고 최대 32,000단어의 문맥을 처리할 수 있음.
수학적 테스트(AIME, MATH)와 MATH-500, GPQA 벤치마크에서 강력한 성능을 보임.
QwQ는 논리적 벤치마크에서 OpenAI의 o1-preview와 비슷하거나 더 나은 성과를 내고 있음.
자기 점검 기능
- QwQ는 답변을 사전에 계획하고 자신의 작업을 두 번 확인하는 자기 검증 시스템을 포함함.
- 처리 시간이 늘어나지만 일반적인 언어 모델과 비교해 정확성이 향상됨.
- "아는 것이 없다는 것을 아는 것"이라는 철학적 정신을 반영하며, 더 깊은 진실을 탐구하려고 함.
- 그러나 언어 전환, 무한 루프, 상식적인 추론에서 어려움을 겪을 수 있음.
Apache 2.0 라이선스로 상업적 사용 가능하나 일부 구성 요소만 공개됨.
Qwen 팀은 2023년 8월 최초 Qwen 모델을 공개했으며, Qwen2, Qwen2.5 시리즈를 출시함.
Qwen2.5 시리즈에는 일반 언어, 프로그래밍, 수학을 위한 전문 버전이 포함됨.
최근에는 더 큰 문맥 윈도우를 위한 Qwen2.5-Turbo 추가됨.
중국의 AI 존재감 확대
- QwQ는 중국에서 나온 두 번째 '추론 모델'이며, DeepSeek 또한 유사한 시스템을 출시함.
- 두 모델 모두 현재는 미니 또는 프리뷰 버전만 제공되며, 연내에 완전한 출시가 예상됨.
- OpenAI의 o1 모델의 전체 능력은 아직 공개되지 않았으며, 아키텍처 차이로 인해 OpenAI가 여전히 유리할 수 있음.

5the-decoder.com링크 복사하기

AI 뉴스 요약은 뉴스의 내용을 AI가 요약(GPT-4 활용)한 것입니다. 따라서 틀린 내용을 포함할 수 있습니다. 뉴스의 자세한 내용을 확인하시려면 해당 뉴스 링크를 클릭해주세요.

📰AI 뉴스 리스트 보기

원본 뉴스 보기