GPT-4 전격 출시 - 늘어난 토큰 제한, 이미지 입력 지원 예정
OpenAI에서 GPT-4를 출시 했습니다. 요즘 AI는 눈을 뜨고 나면 뭐가 달라져 있군요. 주요 업데이트는 다음과 같습니다.
더 정확하고 안전한 응답 결과 생성. 미국의 변호사 시험과 생물학 시험에서 chatgpt보다 더 좋은 성적을 기록함. 예를 들어 변호사 시험의 경우 상위 90%에서 상위 10%로 성능이 향상됨. 기존 대화에서는 차이가 크지 않지만 특정 기준치를 넘으면 더 좋은 결과를 생성한다고 하네요.
입출력의 토큰 한계가 늘어남. 기존의 4096토큰에서 8000토큰 모델(8,192 토큰)과 32000토큰 모델(32,768 토큰, 약 50페이지 분량)이 사용 가능함.
현재 ChatGPT plus (유료 버전)에서 사용할 수 있음. 하루 제한이 있고 유동적으로 조정할 계획. 무료 사용자들에게도 일부 토큰을 사용해 볼 수 있게 추후 개방할 계획.
Visual inputs : 이미지를 input으로 처리할 수 있음. 현재 공개된 버전에서는 아직 도입되지 않았으나 차후 도입 예정임. 이미지 등 다양한 형태의 미디어를 처리할 수 있는 능력을 멀티 모달이라고 함.
공식홈페이지에 있는 예시 사진에서 재료 사진을 주고 무엇을 만들 수 있는지 물어봅니다. 사진 (이미지) 를 분석해서 만들 수 있는 요리를 추천해 주네요.
gpt4 api 대기자 리스트 받음. 역시 api 를 공개하고 대기자 리스트를 받고 있습니다. 가격은 8k 제한 토큰기준으로 prompt tokens는 1k 토큰 당 $0.03 , completion tokens는 1k 토큰 당 $0.06입니다. 32k 제한 토큰은 가격이 2배 입니다. 기존의 gpt 3.5 turbo의 1k당 $0.002에 비하면 비싼 편이네요. gpt4에서 프롬프트 토큰은 사용자가 질문을 하는 토큰을 말하고, completion tokens는 gpt가 응답을 하는 토큰을 이야기 합니다.
새롭게 추가된 프롬프트 양식.
System : gpt의 역할을 정할 수 있는 act as 가 정식 프롬프트 양식으로 포함됐습니다. 이를 통해 사용자들이 gpt의 기능을 특정분야에 한해 사용할 수 있게 프롬프트 엔지니어링을 하라는 의도 같습니다. 그렇게 만들려면 계속 반복적으로 역할이나 고정값을 전송해야 하니깐요. 예를 들어 TaxGPT라고 입력을 하면 세금 분야를 처리하는 챗봇처럼 작동합니다. OpenAI에서 세금 분야에 파인튜닝을 한 것은 아니고 프롬프트 엔지니어링으로 그렇게 행동하게 만든 것입니다. 여기에서 장황함(verbosity), 톤, 스타일 등을 지정할 수 있습니다.
User : 말 그대로 사용자의 입력값.
Assistant : chatbot의 응답.
저는 토큰 제한이 늘어난 것과 이미지 인풋이 가능해진게 신기하네요. 이미지 인풋 기능을 활용하면 사용할 수 있는 범위가 많이 늘어날 것 같습니다.
그리고 긍정적인 면은 더 안전한 응답 생성입니다. 인공지능이 발전하면서 안전성이 정말 중요하다고 생각하는데요. OpenAI에서 이런 면에 중점을 두고 있는 것은 좋다고 생각합니다. 이 안전성이 인공지능을 사회에서 보편적으로 받아들이는데 중요한 요소가 될 것 같아요.
gpt-4 벤치마크
MMLU 벤치마크에서 gpt-4를 테스트한 내용이라고 합니다. (MMLU는 57개의 주제에 대해 14,000의 다지선다 문제를 푸는 테스트)
GPT 3.5 영어보다 높은 성적을 보이는 군요.
TIP : edge의 빙 채팅에 gpt4가 도입됐다고 하니 구독 안하시는 분들은 엣지에서 써보시면 됩니다.
출처 : OpenAI의 GPT-4 출시 소식
유튜브 영상 : GPT-4 Developer Livestream (OpenAI의 회장 Greg Brockman이 시연 영상을 보여줍니다. gpt로 디스코드 봇을 만들고 이미지를 지원하는 것을 보여줍니다. 스케치한 서비스 그림을 인식해서 html, js 코드로 바꿔주는 장면도 나옵니다.)