LLM에서의 Top p 란?

2024-07-30 17:42•조회수 1,409

Top p는 언어 모델이 다음 단어를 선택할 때, 가장 가능성 높은 단어들의 누적 확률이 특정 임계값(p)에 이하까지만 고려하여, 다양성과 일관성 사이의 균형을 맞추는 텍스트 생성 방법입니다.

예를 들어, 언어 모델이 "나는 ___를 먹었다."라는 문장의 빈칸을 채우려 한다고 가정해봅시다. 모델이 예측한 다음 단어의 확률 분포가 다음과 같다고 해보겠습니다:

이제 top p를 0.9(90%)로 설정했다고 가정해봅시다:

이 방식을 통해 top p는:

이런 방식으로 top p는 텍스트 생성의 품질과 다양성 사이의 균형을 맞추는 데 도움을 줍니다.

p는 확률 질량(probability mass)를 의미합니다.

p가 높을 수록 더 다양한 단어들을 포함할 수 있어 창의성이 증가할 수 있습니다.

반면에 p가 낮을 수록 더 안전하고 예측 가능한 텍스트가 생성됩니다.