Cerebras, 가장 빠른 AI Inference를 출시

2024-08-28

제목: Cerebras, 가장 빠른 AI 추론 솔루션 출시
Cerebras Systems, 새로운 AI 추론 솔루션 'Cerebras Inference' 발표
Llama3.1 8B 모델에서 초당 1,800 토큰, Llama3.1 70B 모델에서 초당 450 토큰 처리 가능
기존 NVIDIA GPU 기반 솔루션보다 20배 빠름
가격은 100만 토큰당 10센트부터 시작, AI 워크로드에서 100배 높은 가격 성능
16비트 정밀도를 유지한 상태에서 최대 성능 제공
Cerebras Inference, 다양한 가격 모델 제공: 프리, 개발자, 엔터프라이즈 티어
전략적 파트너십을 통해 AI 개발 가속화
Wafer Scale Engine 3 (WSE-3) 기반의 Cerebras CS-3 시스템 사용
7,000배 높은 메모리 대역폭 제공, OpenAI Chat API와 호환 가능
Cerebras Systems, AI 슈퍼컴퓨터 개발 전문 기업
주요 고객: 주요 기업, 연구 기관, 정부 등

5cerebras.ai링크 복사하기

AI 뉴스 요약은 뉴스의 내용을 AI가 요약(GPT-4 활용)한 것입니다. 따라서 틀린 내용을 포함할 수 있습니다. 뉴스의 자세한 내용을 확인하시려면 해당 뉴스 링크를 클릭해주세요.

📰AI 뉴스 리스트 보기

원본 뉴스 보기