검색
회원가입로그인

Stable Diffusion 3 - 무료로 제공되는 놀라운 AI!

  • 안정적인 확산 3은 텍스트에서 이미지로 변환하는 인공지능으로, 짧은 프롬프트를 작성하면 아름다운 이미지를 얻을 수 있다.
  • 이 기술은 완전히 공개되어 무료로 사용할 수 있다.
  • 해당 분야의 새로운 논문이 공개되었다.
  • 저자는 이전 버전인 '안정적인 확산 엑셀'을 사용했을 때 텍스트를 이용한 이미지 생성 결과가 혼합적이었다고 언급한다.
  • 새로운 기술을 사용하여 생성된 이미지는 신뢰성이 높고 다양한 스타일을 지원한다.
  • 생성된 이미지의 창의성과 질이 뛰어나며, 프랙탈로 묘사된 인간의 삶이나 칼라이도스코프 새 같은 이미지가 예시로 제시된다.
  • 이미지 품질, 예를 들어 물에 떨어지는 잼의 반사 효과는 매우 인상적이다.
  • 연구는 실패의 연구로, 좋은 연구자는 실패 확률을 99%에서 1%로 줄이는 노력을 한다.
  • 새로운 기술은 이미지를 생성하기 위해 잡음으로부터 시작하여 원하는 이미지로 점진적으로 이를 개선하는 확산 기반의 AI 기법이다.
  • '직접 선호 최적화'와 '보정된 플로우' 같은 기법을 사용하여, 프로세스의 효율성을 높이고 더 나은 결과물을 생성한다.
  • 새로운 AI 모델은 80억 개의 파라미터를 사용하여, 많은 사람들이 랩톱이나 클라우드 제공업체를 통해 이용할 수 있으며, 휴대폰에서도 동작할 수 있는 경량 버전이 있다.
  • 연구 결과, 코드, 모델 가중치는 모두 곧 무료로 제공될 예정이다.
  • '젬마' 버전의 Gemini 1.5 Pro AI 어시스턴트도 개발 중이며, 추후 소식은 구독을 통해 확인할 수 있다.
  • '웨이츠 앤 바이어스(Weights & Biases)'는 딥러닝 프로젝트와 대규모 언어 모델(Large Language Model, LLM) 앱의 실험 추적, 모델 평가 및 프로덕션 모니터링을 지원한다.

5youtube.com(Two Minute Papers)링크 복사하기
AI 뉴스 요약은 뉴스의 내용을 AI가 요약(GPT-4 활용)한 것입니다. 따라서 틀린 내용을 포함할 수 있습니다. 뉴스의 자세한 내용을 확인하시려면 해당 뉴스 링크를 클릭해주세요.
원본 뉴스 보기