Stability AI는 향상된 이미지 품질과 더 나은 성능을 제공하는 것을 목표로 하는 차세대 플래그십 텍스트-이미지 모델인 Stable Diffusion 3.0의 미리보기를 선보입니다
- Stability AI가 새로운 텍스트-이미지 생성 AI 모델인 'Stable Diffusion 3.0'의 초기 미리보기를 발표했습니다.
- 이 회사는 지난해 동안 여러 이미지 모델을 출시하며 정교함과 품질을 높여왔습니다.
- Stable Diffusion 3.0은 멀티 서브젝트 프롬프트로부터 더 향상된 이미지 품질과 성능을 제공할 목표를 가지고 있습니다.
- 이 모델은 이전 모델들에 비해 크게 개선된 타이포그래피를 통해 이미지 내에서 보다 정확하고 일관된 철자를 제공할 수 있습니다.
- Stability AI는 800M부터 8B 파라미터까지 다양한 모델 크기로 Stable Diffusion 3.0을 구축하고 있습니다.
- Stable Diffusion 3.0은 기존에 출시되었던 모델의 새로운 버전이 아닌 새로운 아키텍처를 기반으로 하고 있으며, 이는 OpenAI의 Sora 모델과 유사한 Diffusion Transformer로 이루어져 있습니다.
- Stability AI는 최근 Würstchen 아키텍처를 사용한 Stable Cascade를 발표하여 성능과 정확도를 향상시키는 등 이미지 생성을 위한 여러 접근 방식을 실험하고 있습니다.
- Stable Diffusion 3.0은 효율적인 컴퓨팅 사용과 다른 이미지 생성 방식에 비해 우수한 성능을 제공하는 Diffusion Transformers (DiTs)를 이용합니다.
- 또한, 이 모델은 복잡한 데이터 분포를 모델링하기 위해 Continuous Normalizing Flows (CNFs)를 훈련하는 새로운 방법인 flow matching에서 이득을 보고 있습니다.
- Stable Diffusion 3.0의 개선된 타이포그래피는 트랜스포머 아키텍처와 추가 텍스트 인코더 덕분입니다.
- 초기에는 텍스트-이미지 생성 AI 기술로 시연되고 있지만, 정식 출시 이후에 3D 이미지 생성 및 비디오 생성 능력을 포함한 다양한 기능의 기반을 마련할 예정입니다.
5venturebeat.com링크 복사하기
AI 뉴스 요약은 뉴스의 내용을 AI가 요약(GPT-4 활용)한 것입니다. 따라서 틀린 내용을 포함할 수 있습니다. 뉴스의 자세한 내용을 확인하시려면 해당 뉴스 링크를 클릭해주세요.