검색
회원가입로그인

가장 인기 있는 900개의 오픈 소스 AI 도구를 살펴보면서 배운 것

  • 지난 4년간 오픈소스 머신러닝 에코시스템을 분석한 Chip Huyen은 오픈소스 AI 도구에 대한 연구를 다시 수행함
  • 이번 연구는 주로 "기초 모델(foundation models)"을 중심으로 한 스택에 초점을 맞춤
  • 오픈소스 AI 저장소 목록은 'llama-police'에서 호스팅되며, 6시간마다 업데이트 됨
  • 총 896개의 저장소 발견, 이 중 소프트웨어 저장소는 845개로 분석함
  • AI 스택은 인프라, 모델 개발, 애플리케이션 개발 및 애플리케이션이라는 4개의 계층으로 구성됨
  • 인프라 계층은 데이터, 계산, 서빙 툴링 관리 등을 포함하며, 모델 개발은 모델링 및 훈련 프레임워크, 추론 최적화 등의 도구를 제공함
  • 애플리케이션 개발 계층은 프롬프트 엔지니어링, RAG, AI 인터페이스 등을 포함하며, 애플리케이션 계층은 코딩, 워크플로우 자동화 등 다양한 오픈소스 애플리케이션이 있음
  • 개별 계정과 조직 모두에서 대규모 저장소를 운영하고 있으며, 1인 회사의 부상이 보이고 있음
  • 오픈소스 AI 개발자들 중 20,000명 이상이 이 845개 저장소에 기여했으며, 총 백만번 가량의 기여를 함
  • 중국의 오픈소스 AI 생태계는 미국과 다른 경향을 보이며, 중국에서는 여전히 RNN 기반 모델이 인기 있음
  • 많은 저장소들이 급속도로 주목 받았다가 사라지는 "하이프 곡선(hype curve)" 현상을 띠고 있음
  • Chip Huyen은 커뮤니티에서 개발되고 있는 많은 흥미로운 아이디어들을 강조하며, 이러한 리포지토리들에 대한 분석을 통해 AI 에코시스템에 대한 큰 그림을 제공함

5huyenchip.com링크 복사하기
AI 뉴스 요약은 뉴스의 내용을 AI가 요약(GPT-4 활용)한 것입니다. 따라서 틀린 내용을 포함할 수 있습니다. 뉴스의 자세한 내용을 확인하시려면 해당 뉴스 링크를 클릭해주세요.
원본 뉴스 보기