Alibaba의 새로운 Qwen-Image 모델은 이미지 내부에 고품질 텍스트를 생성합니다.

2025-08-07

알리바바가 200억 개의 파라미터를 가진 AI 모델 Qwen-Image를 소개하였습니다. 이 모델은 이미지 내부에 고품질 텍스트를 생성할 수 있는 기능을 갖추고 있습니다.
Qwen-Image는 다양한 시각적 스타일을 처리할 수 있으며, 이중 언어 텍스트 지원 및 매끄러운 언어 전환이 가능합니다.
슬라이드와 프레젠테이션 생성에 직접적인 기능을 가지고 있으며, 이미지 내 대상 물체 추가, 삭제 및 포즈 조정 등의 편집 도구를 제공합니다.
MSRoPE라는 새로운 접근 방식으로 모델이 텍스트를 이미지 내에서 보다 정확하고 효율적으로 배치할 수 있도록 개선되었습니다.
모델의 훈련 데이터는 자연 이미지, 디자인 콘텐츠 등으로 구성되며 AI 생성 이미지 데이터를 제외하고 있습니다.
Qwen-Image는 상업적 모델을 능가하며 특히 중국어 텍스트 처리에서 우수한 성능을 보여주었습니다.
이 모델은 GitHub과 Hugging Face에서 무료로 이용 가능하며, 라이브 데모도 제공됩니다.

3the-decoder.com링크 복사하기

AI 뉴스 요약은 뉴스의 내용을 AI가 요약(GPT-4 활용)한 것입니다. 따라서 틀린 내용을 포함할 수 있습니다. 뉴스의 자세한 내용을 확인하시려면 해당 뉴스 링크를 클릭해주세요.