Stability AI는 향상된 이미지 품질과 더 나은 성능을 제공하는 것을 목표로 하는 차세대 플래그십 텍스트-이미지 모델인 Stable Diffusion 3.0의 미리보기를 선보입니다

2024-02-23

Stability AI가 새로운 텍스트-이미지 생성 AI 모델인 'Stable Diffusion 3.0'의 초기 미리보기를 발표했습니다.
이 회사는 지난해 동안 여러 이미지 모델을 출시하며 정교함과 품질을 높여왔습니다.
Stable Diffusion 3.0은 멀티 서브젝트 프롬프트로부터 더 향상된 이미지 품질과 성능을 제공할 목표를 가지고 있습니다.
이 모델은 이전 모델들에 비해 크게 개선된 타이포그래피를 통해 이미지 내에서 보다 정확하고 일관된 철자를 제공할 수 있습니다.
Stability AI는 800M부터 8B 파라미터까지 다양한 모델 크기로 Stable Diffusion 3.0을 구축하고 있습니다.
Stable Diffusion 3.0은 기존에 출시되었던 모델의 새로운 버전이 아닌 새로운 아키텍처를 기반으로 하고 있으며, 이는 OpenAI의 Sora 모델과 유사한 Diffusion Transformer로 이루어져 있습니다.
Stability AI는 최근 Würstchen 아키텍처를 사용한 Stable Cascade를 발표하여 성능과 정확도를 향상시키는 등 이미지 생성을 위한 여러 접근 방식을 실험하고 있습니다.
Stable Diffusion 3.0은 효율적인 컴퓨팅 사용과 다른 이미지 생성 방식에 비해 우수한 성능을 제공하는 Diffusion Transformers (DiTs)를 이용합니다.
또한, 이 모델은 복잡한 데이터 분포를 모델링하기 위해 Continuous Normalizing Flows (CNFs)를 훈련하는 새로운 방법인 flow matching에서 이득을 보고 있습니다.
Stable Diffusion 3.0의 개선된 타이포그래피는 트랜스포머 아키텍처와 추가 텍스트 인코더 덕분입니다.
초기에는 텍스트-이미지 생성 AI 기술로 시연되고 있지만, 정식 출시 이후에 3D 이미지 생성 및 비디오 생성 능력을 포함한 다양한 기능의 기반을 마련할 예정입니다.

5venturebeat.com링크 복사하기

AI 뉴스 요약은 뉴스의 내용을 AI가 요약 한 것입니다. 따라서 틀린 내용을 포함할 수 있습니다. 뉴스의 자세한 내용을 확인하시려면 해당 뉴스 링크를 클릭해주세요.

📰AI 뉴스 리스트 보기

원본 뉴스 보기