검색
검색
공개 노트 검색
회원가입로그인

OpenAI Spring update - GPT-4o 무료 제공, 데스크탑 앱, 향상된 보이스 모드 = 멀티 모달 에이전트

page thumbnail

OpenAI에서 유튜브 라이브로 공개했습니다.

  • GPT-4o (omnimodel) - 새로운 플래그십 모델. GPT4 수준의 모델이지만 빠른 속도의 텍스트, 비전, 오디오 처리가 가능한 모델.

  • GPT-4o의 효율성으로 다음과 같은 기존의 고급 기능들을 무료 사용자에게 제공. (GPT Store, Vision, Browse, Memory, Advanced Data Analysis)

    OpenAI Spring update - GPT-4o 무료 제공, 데스크탑 앱, 향상된 보이스 모드 = 멀티 모달 에이전트 image 1

  • GPT-4o API 2배 빠름, 50% 저렴함, GPT-4 터보의 5배 정도의 Rate limits.

  • ChatGPT 데스크탑 앱 (맥북, 윈도우 버전은 올해 하반기) : 스크린을 볼 수 있음. (코드 등)

OpenAI Spring update - GPT-4o 무료 제공, 데스크탑 앱, 향상된 보이스 모드 = 멀티 모달 에이전트 image 2

화면의 코드를 보고 이해하는 모습

KakaoTalk_20240514_023729386

그래프에 대해 음성으로 질문하는 모습

  • Web UI 업그레이드.

  • 50개 이상의 UI 언어 지원.

  • 좀 더 자연스러운 ChatGPT 보이스 모드. (중간에 끼어들 수 있음, 기존의 2,3초 기다림 없이 실시간 응답, 감정 있는 목소리) 완전 영화 Her 네요.

OpenAI Spring update - GPT-4o 무료 제공, 데스크탑 앱, 향상된 보이스 모드 = 멀티 모달 에이전트 image 4

  • Voice 모드에서 Vision으로 현실 세계를 보고 응답. (수학 문제 풀기.)

  • 실시간으로 시연 : 실시간 번역. (영어 -> 스페인어), 카메라 보고 감정 맞추기.

  • 향후 몇 주내에 통합될 예정.

또 난리나겠네요...ㅋㅋㅋ

AI 요약

  • 미라 무라티가 새로운 플래그십 모델인 GPT-4o를 소개하며, 이 모델이 무료 사용자에게도 제공될 예정임을 발표함.

  • GPT-4o는 텍스트, 비전, 오디오 기능을 개선하였고, 사용자의 경험을 자연스럽고 간편하게 만드는 것을 목표로 함.

  • 새로운 UI와 통합 기능이 소개되어, 사용자가 ChatGPT와의 상호작용을 더 자연스럽게 느낄 수 있도록 설계됨.

  • GPT-4o는 목소리, 텍스트, 이미지를 통해 더 효율적으로 작동하며, 이를 통해 사용자 경험의 지연을 줄임.

  • 데모에서는 실시간 대화 기능, 복잡한 수학 문제 해결, 코드 분석 및 시각적 콘텐츠의 인식과 상호작용을 시연함.

  • GPT-4o는 개발자들이 API를 통해 더 빠르고 저렴하게 AI 애플리케이션을 개발할 수 있게 해줌.

  • 실시간 번역 기능과 감정 인식 기능도 선보임으로써, ChatGPT가 사용자의 감정 상태를 파악하고 반응할 수 있음을 보여줌.

조금 더 자세한 요약 : TILNOTE GIST - 유튜브 요약 & 웹 페이지 요약

GPT-4o : https://openai.com/index/hello-gpt-4o/

CPT-4o 무료 : https://openai.com/index/gpt-4o-and-more-tools-to-chatgpt-free/

공유하기
카카오로 공유하기
페이스북 공유하기
트위터로 공유하기
url 복사하기
조회수 : 1194
heart
T
페이지 기반 대답
AI Chat