AI Canon - a16z에서 정리한 AI 필수 자료들 (인공지능 학습에 좋은 자료들)
앤드리슨 호로위츠(a16z)에서 인공지능에 대해 필수적인 논문, 블로그 포스트, 코스 등을 정리한 리서치 리스트입니다. 공부할 때 요긴하게 사용할 수 있습니다. 대략적으로 다음과 같은 내용들이 포함되어 있습니다.
원문 링크 : AI Canon | Andreessen Horowitz
일반적인 자료
소프트웨어 2.0 : Andrej Karpathy가 설명한 소프트웨어 2.0에 대한 블로그 글.
State of GPT : Karpathy가 ChatGPT / GPT 모델이 어떻게 작동하고 어떻게 사용하는지 발표한 영상.
트랜스포머 설명 : Dale Markowitz가 LLM이 무엇이고 어떻게 작동하는지 설명.
스테이블 디퓨전은 어떻게 작동하는가?
AI 용어집
기초에 대한 학습 (neural networks, backpropagation, embeddings)
딥러닝 코어 컨셉 설명 by Nvidia
개발자를 위한 딥러닝
Word2vec 설명
backpropagation 설명
강의
스탠포드 CS229 : 앤드류응 교수님의 머신 러닝의 기초를 다루는 강의.
스탠포드 CS224 : Chris Manning 교수님의 NLP 강의.
심화 : 트랜스포머와 대형모델에 대한 이해
트랜스포머에 대한 상세 설명
GPT를 처음부터 코드로 구현하는 영상.
Stable Diffusino 상세 설명 (latent diffusion 모델)
RLHF 상세 설명 by Chip Huyen
실용적인 LLM 사용 가이드
Github 고객센터 봇 만들기 (GPT-3, LangChain, Python)
프롬프트 인젝션 by Simon Willison
파인콘 러닝센터
랭체인 문서
강의
Introduction - Hugging Face NLP Course (허깅페이스의 트랜스포머 강의)
LLM 벤치마크
Chatbot Arena: Benchmarking LLMs in the Wild with Elo Ratings | LMSYS Org
Open LLM Leaderboard - a Hugging Face Space by HuggingFaceH4 (오픈소스 LLM 모델의 랭킹을 볼 수 있음)
마켓 분석
a16z의 다양한 시장 분석. 몇 개만 나열해 봅니다.
The Generative AI Revolution in Games - 게임 분야의 Gen AI
Financial Services Will Embrace Generative AI Faster Than You Think | Andreessen Horowitz - 금융 분야
Generative AI: The Next Consumer Platform | Andreessen Horowitz - 소비 플랫폼 분야
기념비적인 연구 결과
새로운 모델
Attention is all you need
BERT
Language models are few-shot learners
Training language models to follow instructions with human feedback : OpenAI의 InstructGPT를 설명하는 paper
LaMDA
PaLM
OPT
Alpaca: A strong, replicable instruction-following model
모델 개선 (파인튜닝, retrieval, attention 등)
LoRA: Low-rank adaptation of large language models : 마이크로소프트에서 발간한 리서치. LLM을 새로운 데이터에 파인튜닝하는 것에 대한 효과적인 대안책. 현재 이미지 모델에서 많이 사용됨.
Constitutional AI : Anthropic의 reinforcement learning from AI Feedback (RLAIF) 개념.
드림부스
Adding conditional control to text-to-image diffusion models : 스탠포드의 콘트롤넷.
에이전트
ReAct : 프린스턴과 구글에서 LLM의 추론과 계획 능력을 향상시키기 위한 프로젝트.
Generative agents: Interactive simulacra of human behavior : LLM으로 마을 만들기.
Reflexion : 실수로 부터 배울 수 있는 자율에이전트.
Toolformer : 메타에서 LLM에 도구를 주어주는 개념의 프로젝트 진행.
AutoGPT : 특정한 문제를 해결하기 위해 어떤 도구를 사용할지 선택할 수 있는 자율에이전트
BabyGI : 계획과 실행이 가능한 에이전트. 벡터 DB 활용 등.
비디오
Make-A-Video : Meta의 text to video 모델
Imagen : 구글의 text to video 모델
오디오
JukeBox : 2020년 OpenAI의 음악 생성 AI
AudioLM : 구글의 음성 다용도 음성 생성 AI (목소리, 악기 등)
MusicLM - 구글의 text to music 모델
다차원 이미지 생성
NeRF : 5D 좌표를 활용해 복잡한 풍경을 합성
DreamFusion : NeRF를 활용해서 2D 인풋에서 3D 이미지 생성.
개인적인 생각
꽤 중요한 자료들을 다 다룬것 같다. 여기서 2~3개 정도만 골라서 이해해도 도움이 많이 될 것 같다. 눈에 띄이는 것만 대충 추려 봤는데 자세한 학습이 필요하다면 원문 URL을 방문해서 학습하면 좋을 것 같다.