Nvidia가 상업적 애플리케이션을 위한 LLM 트레이닝용 합성 데이터를 생성할 수 있도록 개발자들이 사용할 수 있는 Nemotron-4 340B 모델 가족을 발표했습니다.

2024-06-15

• Nvidia가 Nemotron-4 340B를 발표했음, 개발자들이 상업적 응용 프로그램을 위한 대규모 언어 모델(LLMs) 트레이닝에 사용할 수 있는 합성 데이터 생성 모델군임. • Nemotron-4 340B는 건강 관리, 금융, 제조, 소매 등 모든 산업 분야의 상업적 응용 프로그램을 위한 LLMs 트레이닝에 사용할 수 있는 합성 데이터를 생성하는데 사용할 수 있는 고품질의 오픈 모델 제공함. • 모델군에는 합성 데이터 생성을 위한 기본 모델, 지시 모델, 보상 모델이 포함되어 있음. 이러한 모델들은 Nvidia NeMo 및 Nvidia TensorRT-LLM과 함께 최적화되어 있음. • 개발자들은 Hugging Face를 통해 Nemotron-4 340B를 다운로드할 수 있으며, 곧 ai.nvidia.com에서 모델에 접근할 수 있을 예정임. • 이 합성 데이터 생성 파이프라인을 통해, 개발자들은 정확하고 관련성이 있으며 특정 요구 사항에 부합하는 합성 데이터를 보장하기 위해 반복적으로 개선함. • Nvidia NeMo 및 Nvidia TensorRT-LLM을 사용하여 합성 데이터 생성 및 응답 점수를 보다 효율적으로 최적화할 수 있음. • Nemotron-4 340B Base 모델은 9조 토큰에 대해 트레이닝되었으며, NeMo 프레임워크를 사용하여 특정 사용 사례나 도메인에 맞게 커스텀할 수 있음. • 비즈니스는 클라우드 네이티브 Nvidia AI Enterprise 소프트웨어 플랫폼을 통해 NeMo 및 TensorRT-LLM에 대한 기업급 지원 및 보안에 접근할 수 있음. • Nemotron-4 340B 지시 모델은 광범위한 안전성 평가 및 적대적인 테스트를 거쳤으며, 다양한 위험 지표에 걸쳐 높은 성능을 나타냄.

5blogs.nvidia.com링크 복사하기

AI 뉴스 요약은 뉴스의 내용을 AI가 요약(GPT-4 활용)한 것입니다. 따라서 틀린 내용을 포함할 수 있습니다. 뉴스의 자세한 내용을 확인하시려면 해당 뉴스 링크를 클릭해주세요.

📰AI 뉴스 리스트 보기

원본 뉴스 보기