검색
검색
공개 노트 검색
회원가입로그인

kyutai 오픈 사이언스 AI 연구소와 moshi (gpt-4o와 유사한 멀티모달 모델)

kyutai

큐타이는 오픈 사이언스 연구소로 AI 연구를 위한 비영리 단체입니다. 설립은 2023년 11월 일리아드 그룹 (프랑스의 통신 및 인터넷 업체), CMA CGM (세계적인 해운 및 물류 회사로, 프랑스에 본사를 둠.), 슈미트 사이언스(구글의 전 CEO인 에릭 슈미트가 설립한 과학 연구 및 자선 단체)의 컨소시엄에 의해 설립되었습니다. 미국의 빅 테크 연구소에서 광범위한 경험을 가진 여섯 명의 주요 과학자를 영입함으로써 연구의 강력한 기반을 마련했습니다.

자금 및 구조

큐타이는 3억 3천만 달러의 상당한 예산을 자랑합니다. 이 자금은 주로 일리아드 그룹과 스케일웨이를 포함한 민간 단체에서 조달됩니다. 자비에르 닐(프랑스의 기업가이자 일리아드 그룹의 설립자로, 통신 업계에서 혁신적이며 저렴한 서비스 Free로 유명함)과 로돌프 사드(CMA CGM의 CEO)와 같은 프랑스 억만장자들이 3억 유로를 기부한 것은 큐타이의 잠재력과 AI 연구의 전략적 중요성에 대한 상당한 신뢰를 나타냅니다. Yann LeCun(페이스북 AI 연구소의 수장이자, 현대 AI와 딥러닝의 선구자)과 Bernhard Schölkopf (베른하르트 쇨코프) 같은 유명한 연구자들이 과학 고문으로 활동합니다.

기초 모델

모시 (Moshi)

큐타이의 가장 중요한 기여 중 하나는 실시간 기능과 감정 지능으로 주목받는 멀티모달 기초 모델인 모시의 개발입니다. 모시는 감정을 이해하고 표현할 수 있으며, 다양한 억양으로 말할 수 있으며 7b 파라미터의 모델입니다.

GPT-4o의 특징이 빠른 응답 속도인데 모시도 200ms 의 응답 속도를 가지고 있습니다.

사용은 kyutai: open science AI lab 에서 해볼 수 있습니다.

kyutai 오픈 사이언스 AI 연구소와 moshi (gpt-4o와 유사한 멀티모달 모델) image 1

미국 서버에서 모시랑 대화를 해봤는데 아직 완벽하지는 않네요. 파이썬 코드를 짜달라고 했는데 못하고, 해적 목소리로 이야기 해달라고 했는데 다른 소리를 하네요 ㅎㅎ 그래도 반응 속도 만큼은 gpt-4o 와 비슷한 것 같습니다.

시사점

인공지능을 개발 및 연구해서 오픈소스로 공개할 것이라고 하네요. 자비에르 닐 등 프랑스의 억만 장자들이 3억 유로나 투자한만큼 AI 연구소로써 의미가 있을 것 같습니다. 참고로 큐타이는 일본어로 구체(sphere)라는 뜻이라고 하네요. 200~300ms 의 응답 속도를 가진 AI가 나온다면 인터페이스의 정말 많은 것이 바뀔 것 같습니다. 그리고 곧 보게 될 것 같네요.

kyutai: open science AI lab

공유하기
카카오로 공유하기
페이스북 공유하기
트위터로 공유하기
url 복사하기
조회수 : 554
heart
T
페이지 기반 대답
AI Chat