검색
회원가입로그인

Gemini Diffusion은 레이더 아래로 빠져나간 Google의 가장 중요한 I/O 뉴스일 수 있습니다.

  • Google는 전통적인 단어 예측 방식이 아닌, 확산 기법을 사용하여 텍스트를 생성하는 새로운 언어 모델인 Gemini Diffusion을 테스트하고 있습니다.
  • Gemini Diffusion은 이미지 생성 기법에서 차용하여 랜덤 노이즈를 여러 번 조정하여 텍스트 섹션을 생성합니다. 이는 코드 생성 및 텍스트 편집과 같은 정확성과 일관성이 중요한 작업에 적합합니다.
  • Deepmind는 Gemini Diffusion이 초당 최대 2,000토큰을 생성할 수 있으며, 더 길고 일관적인 답변을 제공합니다. 이는 이전 Gemini 모델보다 더욱 빠르고 경쟁력이 있습니다.
  • 초기 벤치마크에서는 Gemini Diffusion이 특히 프로그래밍 작업에서 Gemini 2.0 Flash-Lite와의 성능을 거의 일치시키며, 제한된 데모로 대기 목록을 통해 접근할 수 있습니다.
  • Oriol Vinyals는 좌에서 우로 진행하는 텍스트 생성의 필요성을 제거하는 것이 꿈이었다며, 데모에서 모델이 너무 빠르게 실행되어 비디오를 느리게 해야 했다고 밝혔습니다.
  • Jack Rae는 이전까지 자가회귀 모델이 확산 모델보다 텍스트 품질에서 더 우수했으나 이 결과가 획기적 순간이라고 평가했습니다.
  • Gemini Diffusion은 현재 실험적인 데모로만 제공되며 관심 있는 사용자는 대기자 명단에 가입할 수 있습니다.

4the-decoder.com링크 복사하기
AI 뉴스 요약은 뉴스의 내용을 AI가 요약(GPT-4 활용)한 것입니다. 따라서 틀린 내용을 포함할 수 있습니다. 뉴스의 자세한 내용을 확인하시려면 해당 뉴스 링크를 클릭해주세요.
원본 뉴스 보기