[UCA수퍼컴아카데미] 라마3-그록 llama3 Groq 70B모델 API코딩 --(3)
소스코드가 울산코딩닷컴 게시물 블로그하단에서 다운로드가능합니다.
LPU 추론칩으로 유명한 그록 groq이 라마3 llama3 70B를 서비스한다. 테슬라 일런 머스크의 AI 모델인 그록 grok과는 단어가 다르다. 상표권은 일단 groq이 갖고있다. 머스크측이 이름을 바꿔야한다.
https://console.groq.com/login
콘솔로 로그인해본다. 그록은 일단 평가용 API를 무료로 제공해준다.
이것만 해도 어디야?
groq의 플레이그라운드와 API 코딩기법을 살펴본다.
API 키를 발급받고, 플레이그라운드에서 라마3 70B 코딩 전 채팅 테스트를 해볼 수 있다. 모델은 구글의 오픈소스 gemma 7B 및 믹스트랄 8x 7B도 지원해준다. 다음 기회에 한번 믹스트랄의 API 코딩 기법도 같이 소개하겠다.
플레이그라운드에서 하이퍼 파라미터 테스트를 한뒤, 맨 하단의 [View Code] 버튼을 누르면 파이썬 코드를 보여준다.
클릭으로 코드를 복제한 뒤, 비주얼스튜디오 코드에서 테스트한다.
model="llama3-70b-8192" 확인한다.
import os
from groq import Groq
client = Groq(
api_key=os.environ.get("GROQ_API_KEY"),
)
chat_completion = client.chat.completions.create(
messages=[
{
"role": "system",
"content": "always answer with korean only ",
"role": "user",
"content": "아이브 안유진의 키는 몇 cm? ",
}
],
model="llama3-70b-8192",
temperature=1,
max_tokens=1024,
top_p=1,
stream=False,
stop=None,
)
print(chat_completion.choices[0].message.content)
원래 스트림 모드부터 만들어주는데, 우린 스트림 모드를 테스트할게 아니라서 chat.completions ( ) 구문내 파라미터인
stream=False,
로 수정, 아래쪽 print() 출력문도 일번적인 출력 구문으로 교체한다.
print(chat_completion.choices[0].message.content)
파이썬에서 코드를 테스트하려면
pip install groq
로 패키지를 먼저 설치한다.
아래는 스트림모드 사용했을때 코드이다.
chunk구문이 보일것이다.
import os
from groq import Groq
client = Groq(
api_key=os.environ.get("GROQ_API_KEY"),
)
chat_completion = client.chat.completions.create(
messages=[
{
"role": "system",
"content": "always answer with korean only ",
"role": "user",
"content": "아이브 안유진의 키는 몇 cm? ",
}
],
model="llama3-70b-8192",
temperature=1,
max_tokens=1024,
top_p=1,
stream=True,
stop=None,
)
for chunk in chat_completion:
print(chunk.choices[0].delta.content or "", end="")
실행은 잘 되지만, 시스템 프롬프트로 한글로 고정시키려해도 한글 출력이 잘 되질 않는다.
xionic llama3 70B 모델에 이어 API 코딩으로 테스트 해볼 수 있는 걸 그록에서 찾았지만, 한국어가 잘 안되서 사실 아쉽긴하다.
안유진 키의 정답은 173cm인데, 학습시킨 데이터 자체가 틀렸다.
RAG기법을 적용해야 제대로 답을 찾을 수 있다. 영어로는 response 데이터가 잘 수신되는걸 볼 수 있다.
According to various sources, Ahn Yujin (안유진), the leader of the K-pop group IVE, is reportedly around 159-160 cm (5 feet 2 inches) tall.
파이썬 소스코드 다운로드
파일 첨부groq_llam3_70b-1.py
UCA울산코딩아카데미
ulsancoding.com
교육문의: 052-708-0001