Nvidia Blackwell GPU는 GPT-4 레벨 모델을 최대 30배 더 빠르게 실행할 수 있습니다.

2024-03-19

Nvidia의 Blackwell GPU는 GPT-4 수준의 모델을 최대 30배 빠르게 처리할 수 있음.
Nvidia CEO Jensen Huang에 따르면, Blackwell은 새로운 산업 혁명을 이끌 주요 동력이 될 것임.
이 플랫폼은 수조 개의 매개변수를 가진 대규모 언어 모델을 가능하게 함.
Blackwell 아키텍처에는 세계에서 가장 강력한 칩인 2080억 개의 트랜지스터가 포함됨.
두 개의 다이가 TSMC의 4NP 공정으로 제조되어 10TB/초의 연결 속도로 단일 CUDA GPU로 작동함.
Blackwell은 AI 애플리케이션용 FP4 정밀도를 제공하는 두 번째 세대 Transformer Engine, GPU 간 데이터 교환을 위한 향상된 NVLink 통신 기술 및 AI 예상 유지보수를 가능하게 하는 새로운 RAS Engine 등의 기능을 포함함.
Blackwell GPU는 FP8에서 20 페타플롭스, FP4에서 40 페타플롭스의 AI 컴퓨팅 파워를 제공함.
H100 GPU와 비교할 때, 훈련 성능은 4배, 에너지 효율은 최대 25배, 추론 성능은 최대 30배 향상됨.
이러한 성능은 새로운 NVLink 및 NVLink Switch 7.2로 가능해져, 효율적인 GPU 간 통신을 가능하게 함.
주요 클라우드 제공업체 및 서버 제조업체들이 Blackwell 플랫폼을 사용할 것으로 Nvidia는 기대함.
새로운 DGX SuperPOD는 액체 냉각의 효율적인 랙 규모 아키텍처를 특징으로 하며, FP4 정밀도에서 11.5 엑사플롭스의 AI 슈퍼컴퓨팅 성능을 제공함.
Nvidia는 또한 DGX B200 시스템을 소개했으며, 이는 AI 모델 훈련, 튜닝 및 추론을 위한 플랫폼임.
이러한 시스템들은 올해 말에 출시될 예정임.

5the-decoder.com링크 복사하기

AI 뉴스 요약은 뉴스의 내용을 AI가 요약(GPT-4 활용)한 것입니다. 따라서 틀린 내용을 포함할 수 있습니다. 뉴스의 자세한 내용을 확인하시려면 해당 뉴스 링크를 클릭해주세요.

📰AI 뉴스 리스트 보기

원본 뉴스 보기