11월 첫째주 틸노트 AI 뉴스레터 - o1 정식 모델이 온다.
11월 첫째주 틸노트 AI 뉴스레터 송부드립니다. 인사이트를 잘 전달드렸으면 좋겠네요.
Google AI, SQLite에서 제로데이 취약점 발견 : 구글의 AI가 SQLite 의 보안 취약점을 발견한 사례입니다. Big sleep 이라는 프로젝트인데 이 덕분에 SQLite 팀은 하루만에 취약점을 고칠 수 있었습니다.
만약 이런 AI가 사용자들이 제출하는 앱이나 크롬 확장 프로그램, 코드 등에 사용된다면 구글은 쉽게 다수의 사용자가 참여하는 프로젝트들을 관리할 수 있겠죠? 이런 것들이 굉장히 경쟁 우위가 될 수 도 있을 것 같습니다.
구글은 이미 내부 AI Goose를 만들어서 사용 중이고 구글의 새로운 코드 중 25%가 AI에 의해 작성된다고 합니다. 이런 회사 내부의 에이전트들이 경쟁 우위를 만들어 낼 수 도 있을 것 같습니다.
선생님들을 위한 AI 프롬프트 작성기 (Feat 에단 몰릭 교수님) : 선생님들이 학습 자료에 생성할 수 있는 AI 프롬프트 작성기입니다. 이 프롬프트를 작성하면 몇 가지 질문을 통해 수업 등에 활용할 수 있는 프롬프트를 만들어 줍니다. 교육에 AI가 어떻게 활용될지 주목하고 있습니다. 이 프롬프트는 와튼 스쿨의 에단 몰릭 교수님이 만든 것입니다.
OpenAI의 SimpleQA 벤치마크 - 모델의 사실성을 평가하는 벤치마크 : OpenAI 에서 모델이 얼마나 사실적인 문제를 잘 해결하느냐 하는 벤치 마크를 출시했습니다. GPT-4o 마저도 40% 미만을 기록하면서 AI의 할루시네이션 문제는 아직 갈 길이 많이 남았다는 점을 보여주고 있습니다.
클로드 데스크탑 앱 공개 (다운로드 링크) : 클로드 데스크탑 앱이 공개됐습니다. 클로드 앱에는 받아 쓰기 도구가 추가되어 10분 길이의 음성을 녹음하고 올릴 수 있습니다. 그 밖에도 다양한 업데이드가 있었는데요. 클로드 내에서 자바스크립트 환경을 실행할 수 있는 데이터 분석 도구도 사용할 수 있습니다. 시각적 분석 PDF는 이제 텍스트뿐만 아니라 시각적 요소들도 이해할 수 있습니다.
클로드 3.5 하이쿠 API도 공개됐습니다. gpt-4o mini나 gemini flash 보다 가격 경쟁력은 없지만 코딩 등에 유용하게 사용할 수 있다고 합니다. 성능은 이전 클로드 3.5 소넷 버전보다 좋다고 합니다.
red panda 의 정체는 Recraft v3 로 밝혀져 : Artificial Analysis 리더보드에서 1위를 차지한 이미지 모델 red_panda 의 정체는 바로 Recraft V3로 밝혀졌습니다. 사용해 보니 꽤 괜찮은 이미지 생성도구입니다. 제가 소개와 사용법은 유튜브 영상으로 만들었으니 필요하시면 시청 부탁드릴게요~!
12월에는 GPT o1 의 정식 모델이 출시될 가능성이 높다고 합니다. 이미 몇몇 사용자들은 ChatGPT 내에서 테스트 되고 있는 것을 확인했다고 합니다. 이미지 분석 기능도 포함될 것 같습니다. 이 말은 o1 이 멀티 모달 모델이 될 가능성이 크다는 것이지요. 저는 굉장히 느리지만 알잘딱깔센으로 똑똑한 AI 모델을 만나게 되지 않을까 생각해 봅니다. o1을 아키텍트로 다른 빠른 모델을 사용하는 방식이 될 것 같아요.
현재 LLM 모델의 파라미터는 5000억개 전후로 추정됩니다. 1조 이상의 파라미터를 가진 모델이 나온다면 세상은 어떻게 될까요? 만약 10조 이상의 모델이 나온다면 AGI에 가깝게 될까요? 아니면 AI가 몸과 월드 모델이 있어야 AGI가 가능해질까요? 애초에 AGI가 나올 필요가 있을까요?
미래에 대해 궁금한 점이 많아지는 11월 초입니다.
평화로운 하루 되시길 바랍니다. 감사합니다.
리크래프트로 만든 레서판다 티셔츠. (product mockup mode)