4월 4주차 틸노트 AI 뉴스레터
4월 4주차 틸노트 AI 뉴스레터 보내드립니다.
허깅 페이스 15조 토큰 규모의 데이터셋 오픈 - FineWeb : 허깅페이스에서 15T 규모의 데이터셋을 오픈했습니다. llama3도 15T 규모의 데이터셋이라고 하죠. CommonCrawl에서 중복된 자료를 제외했다고 합니다.
마이크로소프트에서 작은 모델인 phi-3를 출시했습니다. : 마소에서 phi-3-mini 모델을 공개했습니다. 3.8B (38억) 모델입니다. 이 정도 규모이면 랩탑이나 스마트폰 등 작은 기기에서도 잘 작동할 것 같습니다. Llama 3 8B에 비교해 좋은 성능을 보이는데 비결은 높은 품질의 데이터 (웹데이터 + 합성 데이터) 라고 합니다. ollama, 허깅페이스, 애저 등에서 사용할 수 있습니다.
ollama 모델 윈도우 로컬에서 돌리기 - llama3 8B : llama 8b를 올라마로 로컬에서 설치해서 돌려봤습니다. 윈도우에서도 잘 돌아가네요. 최소 8GB 정도의 일반램이면 7B 모델 정도를 돌릴 수 있다고 합니다.
OpenAI Assistants API 업데이트 v2 - 스트리밍 추가! : OpenAI의 어시스턴트 API가 업데이트 됐습니다. 응답을 실시간으로 받는 스트리밍 기능 등이 추가되었습니다. 24시간 내 비동기 작업에 50% 비용 절감이 되는 BatchAPI도 공개했습니다.
스테이블 디퓨전 3가 API 로 공개되었네요. + 사용해 보기 : 스테이블 디퓨전 3 가 API 버전으로 공개되었습니다. 자체 챗봇인 Stable Assistant Beta 도 공개했습니다. 저도 파이썬 예제로 활용해 봤습니다. 이런 과정을 거쳐 모델이 일반 공개가 될 것으로 보입니다.
이번 주에 들었던 생각은 어떻게 질문하느냐가 중요하다는 것이었습니다. 우리가 하는 질문에 따라 올 수 있는 기회의 창이 다르게 오는 것이 아닐까요?
만약 지금의 AI가 인터넷의 초기 텍스트 버전에 불과하다면 우리는 무엇을 만들 수 있고 활용할 수 있을까요? 저는 앞으로 사람들이 무엇을 만들어 낼지 기대가 됩니다.
그럼에도 불구하고 본질은 변하지 않는다고 생각합니다. 어떻게 질문하는가, 어떻게 생각하는가, 사람에 대한 이해, 가치를 만들 수 있는 능력 등은 앞으로도 계속 중요하고 임팩트를 낼 것입니다.