일론 머스크의 Grok 1.5 발표
Grok-1.5
더 나은 추론 및 128000의 컨텍스트 길이의 모델이다.
가장 눈에 띄는 것은 코딩과 수학 관련된 성능 향상. MATH 벤치마크에서는 50.6% 기록, GSM8K 에서 90%를 기록했다. 그리고 HumanEval에서는 74.1%를 기록했다.
전작인 Grok-1에 비해 많이 성능이 늘어났고 다른 모델들도 따라가는 모습이다.
Grok 1.5는 다양한 분산 훈련 플랫폼에서 JAX, Rust, Kubernetes 등을 활용해 만들어 졌다고 한다. Grok-1 은 두 달만에 훈련되었다고 한다. 역시 일론이 테슬라 등을 통해서 컴퓨팅 파워를 소유하고 있으니 빠르게 훈련시킬 수 있는 것 같다. AI 모델 개발력 = 컴퓨팅 파워 + 데이터 + 탑급 리서처 인것 같다.
참고로 Grok은 원래 프리미엄+ 구독자(월 16달러, 연 168달러) 들만 이용가능했으나 이제 프리미엄 구독자(월 8불, 연 84불)들도 사용할 수 있게 된다.
공유하기
조회수 : 304