OpenAI Spring update - GPT-4o 무료 제공, 데스크탑 앱, 향상된 보이스 모드 = 멀티 모달 에이전트
OpenAI에서 유튜브 라이브로 공개했습니다.
GPT-4o (omnimodel) - 새로운 플래그십 모델. GPT4 수준의 모델이지만 빠른 속도의 텍스트, 비전, 오디오 처리가 가능한 모델.
GPT-4o의 효율성으로 다음과 같은 기존의 고급 기능들을 무료 사용자에게 제공. (GPT Store, Vision, Browse, Memory, Advanced Data Analysis)
GPT-4o API 2배 빠름, 50% 저렴함, GPT-4 터보의 5배 정도의 Rate limits.
ChatGPT 데스크탑 앱 (맥북, 윈도우 버전은 올해 하반기) : 스크린을 볼 수 있음. (코드 등)
화면의 코드를 보고 이해하는 모습
그래프에 대해 음성으로 질문하는 모습
Web UI 업그레이드.
좀 더 자연스러운 ChatGPT 보이스 모드. (중간에 끼어들 수 있음, 기존의 2,3초 기다림 없이 실시간 응답, 감정 있는 목소리) 완전 영화 Her 네요.
Voice 모드에서 Vision으로 현실 세계를 보고 응답. (수학 문제 풀기.)
실시간으로 시연 : 실시간 번역. (영어 -> 스페인어), 카메라 보고 감정 맞추기.
향후 몇 주내에 통합될 예정.
또 난리나겠네요...ㅋㅋㅋ
AI 요약
미라 무라티가 새로운 플래그십 모델인 GPT-4o를 소개하며, 이 모델이 무료 사용자에게도 제공될 예정임을 발표함.
GPT-4o는 텍스트, 비전, 오디오 기능을 개선하였고, 사용자의 경험을 자연스럽고 간편하게 만드는 것을 목표로 함.
새로운 UI와 통합 기능이 소개되어, 사용자가 ChatGPT와의 상호작용을 더 자연스럽게 느낄 수 있도록 설계됨.
GPT-4o는 목소리, 텍스트, 이미지를 통해 더 효율적으로 작동하며, 이를 통해 사용자 경험의 지연을 줄임.
데모에서는 실시간 대화 기능, 복잡한 수학 문제 해결, 코드 분석 및 시각적 콘텐츠의 인식과 상호작용을 시연함.
GPT-4o는 개발자들이 API를 통해 더 빠르고 저렴하게 AI 애플리케이션을 개발할 수 있게 해줌.
실시간 번역 기능과 감정 인식 기능도 선보임으로써, ChatGPT가 사용자의 감정 상태를 파악하고 반응할 수 있음을 보여줌.
조금 더 자세한 요약 : TILNOTE GIST - 유튜브 요약 & 웹 페이지 요약
GPT-4o : https://openai.com/index/hello-gpt-4o/
CPT-4o 무료 : https://openai.com/index/gpt-4o-and-more-tools-to-chatgpt-free/