gpt-3 - 인공지능 엔진으로 텍스트를 생성한다.
Open AI에서 개발한 인공지능 자연어 처리 엔진
gpt-3란 openAI에서 개발한 자연어 처리 인공지능 엔진이다.
글 생성 엔진 (text generation) 이라고 생각하면 된다. 안드로이드앱을 홍보하는 문구를 만들어줘라고 질의하면 해당 문구를 생성해낼 수 있다.
문장에서 다음 단어를 예측하는 원리 (토큰화, 패턴 매칭) 를 활용한다. 주로 명령이나 질문을 주고 (prompt) 이에 대해 완성(completion)을 하는 형태이다. 모든 종류의 언어 관련 활동에 쓰일 수 있다고 한다.
gpt의 의미는 Generative Pre-trained Transformer 이다.
대표적인 사례
github의 코파일럿(copilot) : codex (codex는 자연어를 코드로 변환해주는 기술을 말한다.) 를 활용해 코드 자동완성을 해준다. (써본 사람은 안다. 장난 아니다…)
Keeper Tax : 프리랜서가 세금 환급이 가능한 비용을 자동으로 찾을 수 있게 해주는 서비스. 은행 계좌 내역 등을 조회하여 환급이 가능한 비용의 패턴을 찾는다.
듀오링고 : 프랑스어 문법 교정. 더 자연스러운 제2언어 쓰기 교정이 가능해졌다고 한다.
gpt3로 할 수 있는 일들
콘텐츠 만들기
Q&A
문법 교정
자연어로 질의하기 (sql, python, openAI api 등)
텍스트 요약
카테고리 분류
번역
챗봇
데이터 추출
그 밖에 할 수 있는일이 많다.
openAI 사이트
gpt3 가격
다빈치 모델의 경우 $0.0200 / 1K tokens. 1000토큰은 영문으로 750 단어.
플레이 그라운드에서 gpt3를 사용해 볼 수 있다. (18달러의 크레딧을 1달 정도의 기간 동안 무료로 준다.)
codex를 활용해 자연어 처리로 코딩을 하는 동영상 : https://www.youtube.com/watch?v=Zm9B-DvwOgw
한글 gpt-3
카카오 브레인에서 만든 KoGPT. 60억개의 매개변수와 2000억개 토큰(token)의 한국어 데이터를 바탕으로 구축. 이걸 초거대 ai라고 부르는 듯하다.
https://github.com/kakaobrain/kogpt
ainize(오픈소스를 호스팅해주는 서비스)에서 kogpt 데모를 사용해 볼 수 있다.