검색
회원가입로그인

알리바바의 Qwen AI 부서는 개발자가 코드를 작성하고 분석하는 데 도움을 주기 위해 유능한 새로운 모델을 출시합니다.

  • Alibaba의 AI 연구 부서 Qwen에서 소프트웨어 개발을 위해 특별히 설계된 새로운 AI 모델 시리즈 Qwen-2.5-Coder를 출시함.
  • 이 모델들은 개발자가 코드를 작성, 분석, 이해하는 데 도움을 주며, 0.5에서 320억 파라미터까지 다양한 크기의 모델을 포함하고 있음.
  • Qwen은 AI 기반 코드 편집기 Cursor와 ChatGPT 또는 Claude와 유사한 웹 기반 챗봇에 이 모델들을 응용하여 테스트함.
  • Qwen-2.5-Coder-32B-Instruct 모델은 코드 생성, 수리, 논리적 추론 등에서 높은 성능을 보였으며, GPT-4o와 비교할 만한 성능을 나타냄.
  • 모델들은 20조 개 이상의 토큰으로 훈련되었으며, 이는 공개된 모델 중 최초로 이러한 규모를 초과함.
  • 주요 모델인 Qwen-2.5-Coder-32B-Instruct는 Python, Java, JavaScript와 같은 일반 프로그래밍 언어뿐만 아니라 Haskell, Racket과 같은 특수 언어도 지원함.
  • 대부분의 모델은 Apache 2.0 라이선스로 GitHub에서 사용할 수 있으며, 무료 데모는 Hugging Face에서 테스트 가능함.
  • 모델 크기와 데이터의 확장이 프로그래밍 작업 전반에서 일관되게 더 나은 결과를 가져온다는 것을 발견함.

4the-decoder.com링크 복사하기
AI 뉴스 요약은 뉴스의 내용을 AI가 요약(GPT-4 활용)한 것입니다. 따라서 틀린 내용을 포함할 수 있습니다. 뉴스의 자세한 내용을 확인하시려면 해당 뉴스 링크를 클릭해주세요.
원본 뉴스 보기