Google IO 2024 이벤트 - Gemini Flash, AI 오버뷰, Project Astra, 음악 및 비디오 생성
한국 시간으로는 5월 15일 수요일 오전 2시에 열렸습니다. 정말 구글도 장난이 아니네요.
구글 키노트
AI 오버뷰 : SGE를 업그레이드. 검색 결과에서 AI가 생성한 답변을 볼 수 있음.
구글 포토 : 사진을 기반으로 AI로 질문을 할 수 있음. (Ask photos)
Gemini 1.5 Pro : 1백만 토큰. (코드 베이스를 넣고 질문, 책장을 동영상으로 찍고 제목과 저자에 대한 목록을 작성 하기 등의 예시) 모든 글로벌 개발자가 사용 가능.
Gemini Advanced : 2백만 토큰 컨텍스트 윈도우로 확장.
구글 워크스페이스 : 이메일 요약하기, 구글 밋의 하이라이트 (요약) 제공.
노트북 LM : 왼쪽의 매트리얼을 바탕으로 요약, 스터디 가이드, FAQ, 퀴즈, 오디오 오버뷰 등이 가능.
에이전트 (추론, 계획, 메모리, 멀티플 스텝, 크로스 플랫폼) : 신발을 주문해 주는 쇼핑 에이전트 등.
구글 딥마인드 (데미스 허사비스)
알파 폴드 3, 제미나이 모델 등 다양한 노력을 기울여옴.
Gemini 1.5 Flash : 경량화 버전. 1백만 토큰. AI 스튜디오와 버텍스 AI에서 사용 가능.
Project Astra : 일상생활을 도와주는 AI 에이전트. context를 이해하고 행동을 취할 수 있음.
내 안경이 어디 있었지? 빨간 사과 옆에 데스크에 있습니다.
창의적인 작업
Imagine 3 (이매진 3) : 향상된 이미지 모델. labs.google 에서 공개.
Music AI Sandbox : 음악을 만들 수 있는 환경. (MusicFX 이제 한국에도 사용할 수 있습니다.)
Veo (비오) : Video 생성 모델. VideoFX에서 사용하고 편집할 수 있음. 일관성, 퀄리티 등 향상.
소수의 크리에이터들과 협업하며 공개. (labs.google) Sora의 경쟁자가 될 것 같네요.
머신러닝 인프라
Trillium : 6세대 TPU. 2024년 후반에 클라우드 고객에게 공개.
Axion 프로세서 (Arm 기반 CPU)
Nvidia 블랙웰 2025년 초반에 가능.
AI 하이퍼 컴퓨터.
1GW까지 가능한 수냉 시스템.
AI Overviews (AI 오버뷰, 검색)
복잡한 질문을 할 수 있고 각 검색 결과를 조합하여 결과를 생성해줌. 멀티스텝 리즈닝이 가능. 미국부터 배포.
보스턴에 있는 요가와 필라테스 스튜디오를 찾아줘. 그리고 그들의 간략한 소개와 비콘힐에서 걸어서 갈 때 걸리는 시간을 알려줘.
식단, 여행 등 계획을 생성
3일치 식단을 짜줘.
AI 가 조직화하는 검색 결과 (AI Organized Search Result.)
비디오로 질문하기 (Ask with video) : 비디오 첨부해서 질문하기
워크스페이스
지메일 앱에서 이메일 요약하기, 검색, 답장하기.
데이터를 기반으로 질문하기, 워크플로우 기능 등.
AI Teammate
역할, 지침 등을 지정해서 AI 팀메이트를 만들 수 있음.
제미나이 앱
제미나이 라이브 : 실시간 대화. 올 여름 공개.
비디오 인식 : 올해 하반기.
Gems (젬)
젬. 커스텀 챗봇. GPTs와 같은 커스텀 챗봇.
AI 어시스턴트 : 여러 검색 결과를 결합해서 이를 바탕으로 여행 계획 등을 세울 수 있음.
Gemini advanced : 긴 컨텍스트 윈도우. 올해 말까지 2백만 토큰으로 늘림. 35개의 이상의 언어 지원.
안드로이드
AI 검색 (Circle to Search)
Gemini 어시스턴트 : 맥락 이해 = Context aware. (내가 보고 있는 유튜브 비디오에 대해 질문하기, 보고 있는 PDF를 바탕으로 질문하기)
로컬 LLM (Gemini nano with multimodality)
안드로이드 사기전화 방지. (로컬 작동)
안드로이드 15.
개발자
Gemini 1.5 Pro, Flash 200개 이상의 국가에서 사용 가능. (ai.google.dev = 2백만 토큰 가입) Context 캐싱 등.
1.5 Pro 가격은 1백만 토큰 당 7달러. 128K 까지는 50% 할인된 3.5달러에 제공. Google 1.5 Flash는 1백만 토큰에 대해 0.35 달러에 제공. 무료 사용량 범위도 많이 늘었습니다. Gemini API 가격 책정 | Google AI for Developers | Google for Developers
AI Studio에서 가장 빠르게 시작. 엔터프라이즈 레벨이 되면 vertex -> 구글 클라우드의 순으로 업그레이드 하면 됨.
Gemma 7b, 2b (PaliGemma - 오픈소스 Vision 모델!)
Gemma2 6월에 사용 가능하게 될 예정. (27B)
안전
책임감 있는 AI 개발. AI 기반의 레드티밍.
LearnLM
어떤 주제에 대한 개인적인 튜터. Gem을 사용한 러닝 코치 공개 예정. 유튜브에 비디오에 대해 질문하고 퀴즈를 풀 수 있는 기능 제공. Generative AI for educators 강의 등.