GPT-2 (2019) 논문 노트
GPT-2 논문의 핵심 아이디어인 decoder-only Transformer scaling, WebText, next-token prediction, zero-shot task transfer, staged release 논쟁을 정리한 논문 노트.
Read MoreGPT-2 논문의 핵심 아이디어인 decoder-only Transformer scaling, WebText, next-token prediction, zero-shot task transfer, staged release 논쟁을 정리한 논문 노트.
Read More