화웨이 Ascend 910C는 Nvidia H100 추론 성능의 60%를 제공합니다.
- 화웨이의 하이실리콘 어센드 910C는 2019년에 소개된 AI 훈련용 프로세서인 어센드 910의 버전.
- 어센드 910의 성능은 대규모 AI 모델 훈련에 비교적 부족하지만, 추론에서는 엔비디아 H100 성능의 60%를 제공.
- DeepSeek 연구자들에 따르면, 수동으로 CUNN 커널을 최적화하면 효율을 더 높일 수 있음.
- DeepSeek의 PyTorch 저장소와 어센드 프로세서에 대한 네이티브 지원 덕분에 CUDA에서 CUNN으로의 전환이 쉬움.
- 미국 정부의 제재와 TSMC의 최첨단 공정 기술의 부재에도 불구하고, 화웨이의 AI 프로세서 성능은 빠르게 발전 중.
- 화웨이와 SMIC는 2019-2020년 기술 수준에 도달해 엔비디아의 A100 및 H100 프로세서와 경쟁 가능한 칩을 생산했음.
- 어센드 910C는 AI 훈련에는 최적이 아니며, AI 훈련에서는 여전히 엔비디아가 확고한 우위를 점하고 있음.
- DeepSeek의 유천 진은 장기적인 훈련 신뢰성이 화웨이 프로세서의 중요한 약점이라고 지적.
- 어센드 910C는 칩렛 패키징을 사용하며 530억 개의 트랜지스터를 포함.
- 어센드 910의 연산 칩렛은 TSMC의 N7+ 공정 기술로 제조되었고, 어센드 910C의 연산 칩렛은 SMIC의 2세대 7nm 공정 기술인 N+2로 제조.
- AI 모델이 Transformer 아키텍처로 수렴함에 따라 엔비디아의 소프트웨어 생태계 중요성이 감소할 가능성 있음.
- 중국이 글로벌 규모에서 경쟁하기 위해서는 훈련 안정성 문제를 극복하고 AI 컴퓨팅 인프라를 더 정교하게 다듬어야 함.
4tomshardware.com링크 복사하기
AI 뉴스 요약은 뉴스의 내용을 AI가 요약(GPT-4 활용)한 것입니다. 따라서 틀린 내용을 포함할 수 있습니다. 뉴스의 자세한 내용을 확인하시려면 해당 뉴스 링크를 클릭해주세요.