Paper-reading

All Posts llm (17)develop (16)architecture (16)paper-reading (14)javascript (11)ai-agent (10)react (7)transformer (7)post (6)jekyll (5)ai (5)question (4)typescript (4)agent (4)mcp (4)github (3)react-native (3)nextjs (3)browser-automation (3)claude-code (3)interview (2)frontend (2)rails (2)html (2)css (2)git (2)bash (2)script (2)leetcode (2)openclaw (2)python (2)lightpanda (2)cdp (2)go (2)agent-browser (2)playwright (2)arxiv (2)math (2)bert (2)redis (2)backend (2)skills (2)book (1)front-end (1)job (1)daily (1)algorithm (1)conference (1)angularjs (1)reactjs (1)django (1)gcp (1)ios (1)ml (1)keras (1)뉴스-머신러닝 (1)뉴스-크롤링 (1)빅카인즈 (1)angular (1)지킬 (1)에러 (1)bundle (1)form (1)hook (1)test (1)product (1)toy-project (1)gatsby (1)github-blog (1)migration (1)infra (1)domain (1)aws (1)route53 (1)아임웹 (1)postgresql (1)orm (1)error (1)civic-hacking (1)firebase (1)problemsolving (1)bit-manipulation (1)ruby (1)til (1)langchain (1)zig (1)browser (1)headless (1)v8 (1)nanoclaw (1)claude (1)ollama (1)llamacpp (1)local-ai (1)rust (1)vercel (1)mermaid (1)contentlayer (1)rehype (1)blog (1)beads (1)issue-tracker (1)distributed-system (1)dolt (1)orchestration (1)paperclip (1)open-source (1)comparison (1)loss (1)cross-entropy (1)perplexity (1)softmax (1)probability (1)vector (1)dot-product (1)moc (1)research (1)e2e (1)testing (1)attention (1)qkv (1)residual (1)layernorm (1)ffn (1)bloom-filter (1)database (1)scaling (1)game-dev (1)encoder-only (1)decoder-only (1)rnn (1)sequence-modeling (1)masked-language-model (1)mlm (1)pre-training (1)fine-tuning (1)training (1)redisbloom (1)signup (1)superpowers (1)codex (1)encoder (1)decoder (1)agentmemory (1)memory (1)iii (1)hermes-agent (1)nousresearch (1)tools (1)gateway (1)dify (1)llm-app (1)rag (1)workflow (1)plugin (1)flask (1)gpt-2 (1)zero-shot (1)openai (1)openhands (1)coding-agent (1)sandbox (1)fastapi (1)software-agent-sdk (1)ruflo (1)claude-flow (1)agentdb (1)swarm (1)

2026년 5월 17일

GPT-2 (2019) 논문 노트

llm paper-reading transformer gpt-2 zero-shot openai

GPT-2 논문의 핵심 아이디어인 decoder-only Transformer scaling, WebText, next-token prediction, zero-shot task transfer, staged release 논쟁을 정리한 논문 노트.

2026년 4월 18일

BERT (2018) 논문 노트

llm paper-reading transformer bert arxiv

BERT 논문의 핵심 아이디어인 양방향 Transformer encoder, masked language model, next sentence prediction, fine-tuning 패러다임을 정리한 논문 노트.

2026년 4월 18일

LLM 구조 기초: Encoder-only와 Decoder-only

llm transformer encoder-only decoder-only paper-reading

BERT와 GPT 계열을 구분하는 encoder-only, decoder-only 구조를 비교합니다.

2026년 4월 18일

LLM 기초: RNN과 순차 처리

llm rnn sequence-modeling paper-reading

Transformer 이전의 대표 구조인 RNN이 문장을 순서대로 처리하는 방식과 한계를 설명합니다.

2026년 4월 18일

LLM 학습 기초: Masked Language Model

llm masked-language-model mlm bert paper-reading

BERT의 핵심 학습 목표인 Masked Language Model을 수식, 해설, 예시로 설명합니다.

2026년 4월 18일

LLM 학습 기초: Pre-training과 Fine-tuning

llm pre-training fine-tuning training paper-reading

대규모 사전학습과 태스크별 fine-tuning이 무엇인지 BERT 흐름에 맞춰 설명합니다.

2026년 4월 18일

Transformer 기초: Encoder와 Decoder

llm transformer encoder decoder paper-reading

Transformer encoder와 decoder가 각각 어떤 역할을 하는지 원래 구조와 쉬운 예시로 설명합니다.

2026년 4월 17일

Attention Is All You Need (2017) 논문 노트

llm paper-reading transformer arxiv

Transformer 논문의 핵심 아이디어, 왜 중요했는지, 다음에 읽을 논문까지 연결하는 시작 노트.

2026년 4월 17일

LLM 학습 기초: cross-entropy와 perplexity

llm loss cross-entropy perplexity paper-reading

모델이 얼마나 틀렸는지 측정하는 cross-entropy와 perplexity를 수식, 해설, 예시로 설명합니다.

2026년 4월 17일

LLM 수학 기초 2: softmax와 확률 해석

llm math softmax probability paper-reading

softmax가 점수를 확률처럼 바꾸는 원리를 수식, 해설, 예시로 정리합니다.

2026년 4월 17일

LLM 수학 기초 1: 벡터와 내적

llm math vector dot-product paper-reading

LLM 논문을 읽기 전에 꼭 알아두면 좋은 벡터와 내적의 의미를 수식, 해설, 예시로 정리합니다.

2026년 4월 17일

LLM 논문 진화 지도 (MOC)

llm paper-reading moc research

Transformer부터 시작해 LLM 핵심 논문을 순서대로 읽기 위한 Map of Content 페이지입니다.

2026년 4월 17일

Transformer 기초: Q, K, V 직관

llm transformer attention qkv paper-reading

Q, K, V가 각각 어떤 역할을 하는지 attention 수식, 해설, 예시로 설명합니다.

2026년 4월 17일

Transformer 기초: Residual, LayerNorm, FFN

llm transformer residual layernorm ffn paper-reading

Transformer 블록에서 Residual, LayerNorm, FFN이 왜 필요한지 수식, 해설, 예시로 설명합니다.