Diffusers가 FLUX-2를 환영합니다.
- FLUX.2는 Black Forest Labs가 개발한 새로운 이미지 생성 모델군으로, Flux.1 시리즈 후속 모델입니다. 새로운 구조를 가지고 있으며 새로운 사전 학습을 통해 제작되었습니다.
- FLUX.2는 이미지와 텍스트 기반으로 이미지를 생성할 수 있으며, 여러 이미지를 참조 입력으로 사용할 수 있습니다.
- 텍스트 인코더로 Mistral Small 3.1을 사용하여 보다 간단한 이미지를 생성할 수 있으며, 중간 레이어에 출력물을 쌓아 더 유익한 임베딩을 제공합니다.
- FLUX.2는 MM-DiT + 병렬 DiT 아키텍처를 따라가며, 더 많은 단일 스트림 블록을 포함하여 구조가 개선되었습니다.
- 새로운 Autoencoder, 명명된 AutoencoderKLFlux2가 있으며, 해상도 의존적인 타임스텝을 더 효율적으로 활용할 수 있게 되었습니다.
- FLUX.2의 추론은 다양한 시스템 제약 내에서 접근 가능하도록 VRAM을 절감하며, 추론 최적화 기법들을 적용할 수 있습니다.
- FLUX.2는 여러 이미지 입력을 지원하며, 최대 10개의 이미지를 사용할 수 있습니다.
- 고급 프롬프트 기술을 지원하며, JSON 구조화, 정확한 색상 조정, 다중 참조를 통한 이미지 편집 등이 가능합니다.
- FLUX.2는 LoRA 미세 조정을 통해 텍스트-이미지 및 이미지-이미지 모델로 활용할 수 있으며, 메모리 최적화를 통해 소비자를 위한 GPU에서 성공적으로 미세 조정할 수 있습니다.
- 다양한 모듈형 설계를 통해 로컬 및 원격 추론을 결합하여 VRAM 사용을 최적화할 수 있습니다.
- FLUX.2는 Diffusers의 통합 기능을 활용하여 다양한 메모리 제약 조건에서 효율적으로 작동할 수 있도록 설계되었습니다.
4huggingface.co링크 복사하기
AI 뉴스 요약은 뉴스의 내용을 AI가 요약(GPT-4 활용)한 것입니다. 따라서 틀린 내용을 포함할 수 있습니다. 뉴스의 자세한 내용을 확인하시려면 해당 뉴스 링크를 클릭해주세요.
