Qwen2.5-Coder

소개

Qwen2.5-Coder는 Alibaba Cloud의 Qwen 팀이 개발한 대규모 언어 모델 시리즈 Qwen2.5의 코드 버전입니다. 이 모델은 강력하고 다양한 코딩 능력을 제공하며, 여러 가지 실제 시나리오에서 실용성을 증명하고 있습니다. Qwen2.5-Coder는 오픈소스 코드 LLM을 지속적으로 발전시키기 위한 노력의 일환으로 공개되었습니다.

주요 특징

강력한 코드 능력

Qwen2.5-Coder-32B-Instruct는 현재 오픈소스 코드 모델 중에서 가장 뛰어난 모델로 평가받고 있으며, GPT-4o와 비교될 만한 코딩 능력을 갖추고 있습니다. 이 모델은 강력하고 포괄적인 코딩 능력을 보여주며, 일반적인 능력과 수학적 능력에서도 우수한 성능을 발휘합니다.

강력한 코딩 능력을 갖춘 오픈소스 모델, 알리바바 클라우드의 Qwen2.5-Coder 출시! image 1

다양한 모델 크기

기존에 공개된 Qwen2.5-Coder 시리즈는 1.5B와 7B의 두 가지 모델 크기를 포함했지만, 이번 릴리즈에서는 0.5B, 3B, 14B, 32B의 네 가지 모델 크기를 추가로 제공합니다. 이로써 Qwen2.5-Coder는 총 6가지 주요 모델 크기를 제공하여 다양한 개발자들의 요구를 충족시킵니다.

기술적 세부사항

Qwen2.5-Coder는 128K 토큰의 긴 문맥 이해와 생성을 지원하며, 92개의 프로그래밍 언어를 지원합니다. 이 모델은 기본 모델에서 수학적 및 일반적인 능력을 유지하면서 다방면에서 뛰어난 성능을 발휘합니다.

사용

ollama 등에서 사용이 가능합니다. 64GB MacBook Pro M2에서 실행할 수 있었다고 합니다. (ollama + MLX. M2 MAX 최고 사양일 듯.)

현재 LLM 사용의 80%가 코드 지원과 관련이 있다고 합니다. 그렇기 때문에 꽤 주목할만한 소식입니다.