와우, Moondream 3 미리보기는 염소입니다.
- Moondream 3은 상업적 프로젝트에 사용할 수 있지만 재판매는 불가능한 오픈 비전 언어 모델입니다.
- 9억 개의 매개변수를 가진 MOE 모델(전문가 혼합 모델)로, 2억 개의 활성 매개변수를 사용합니다.
- 소비자 하드웨어에서 실행할 수 있으며, Hugging Face에서 다운로드하여 사용할 수 있습니다. 액세스 권한이 필요합니다.
- 객체 감지, 이미지 관련 질문, 특정 사물 포인트 지정을 수행할 수 있습니다.
- 구조화된 출력(JSON)을 제공할 수 있으며, 메뉴 카드 식별도 가능합니다.
- 테스트 결과 빠르고 정확한 객체 감지 성능을 보였습니다. 예를 들어 고래, 창문, 총 등의 사물을 올바르게 감지합니다.
- GUI 객체를 식별할 수 있으며, 프로그램 이름 및 재료 그룹 값을 정확히 탐지합니다.
- 상용으로 사용 가능하지만 재판매하려면 허가가 필요하며, 전체적으로 언더레이티드한 모델입니다.
- 사용해 본 경험이 있거나 추가 튜토리얼이 필요하다면 의견을 환영합니다.
3youtube.com(1littlecoder)링크 복사하기
AI 뉴스 요약은 뉴스의 내용을 AI가 요약 한 것입니다. 따라서 틀린 내용을 포함할 수 있습니다. 뉴스의 자세한 내용을 확인하시려면 해당 뉴스 링크를 클릭해주세요.
