Nvidia Blackwell GPU는 GPT-4 레벨 모델을 최대 30배 더 빠르게 실행할 수 있습니다.
- Nvidia의 Blackwell GPU는 GPT-4 수준의 모델을 최대 30배 빠르게 처리할 수 있음.
- Nvidia CEO Jensen Huang에 따르면, Blackwell은 새로운 산업 혁명을 이끌 주요 동력이 될 것임.
- 이 플랫폼은 수조 개의 매개변수를 가진 대규모 언어 모델을 가능하게 함.
- Blackwell 아키텍처에는 세계에서 가장 강력한 칩인 2080억 개의 트랜지스터가 포함됨.
- 두 개의 다이가 TSMC의 4NP 공정으로 제조되어 10TB/초의 연결 속도로 단일 CUDA GPU로 작동함.
- Blackwell은 AI 애플리케이션용 FP4 정밀도를 제공하는 두 번째 세대 Transformer Engine, GPU 간 데이터 교환을 위한 향상된 NVLink 통신 기술 및 AI 예상 유지보수를 가능하게 하는 새로운 RAS Engine 등의 기능을 포함함.
- Blackwell GPU는 FP8에서 20 페타플롭스, FP4에서 40 페타플롭스의 AI 컴퓨팅 파워를 제공함.
- H100 GPU와 비교할 때, 훈련 성능은 4배, 에너지 효율은 최대 25배, 추론 성능은 최대 30배 향상됨.
- 이러한 성능은 새로운 NVLink 및 NVLink Switch 7.2로 가능해져, 효율적인 GPU 간 통신을 가능하게 함.
- 주요 클라우드 제공업체 및 서버 제조업체들이 Blackwell 플랫폼을 사용할 것으로 Nvidia는 기대함.
- 새로운 DGX SuperPOD는 액체 냉각의 효율적인 랙 규모 아키텍처를 특징으로 하며, FP4 정밀도에서 11.5 엑사플롭스의 AI 슈퍼컴퓨팅 성능을 제공함.
- Nvidia는 또한 DGX B200 시스템을 소개했으며, 이는 AI 모델 훈련, 튜닝 및 추론을 위한 플랫폼임.
- 이러한 시스템들은 올해 말에 출시될 예정임.
5the-decoder.com링크 복사하기
AI 뉴스 요약은 뉴스의 내용을 AI가 요약(GPT-4 활용)한 것입니다. 따라서 틀린 내용을 포함할 수 있습니다. 뉴스의 자세한 내용을 확인하시려면 해당 뉴스 링크를 클릭해주세요.