AI 2026.05.03 · 12 min
Advanced Pretrained Lm Deep Dive · 7
Instruction에서 Reasoning까지 — LLM은 어떻게 생각을 배우는가
Instruction Tuning의 zero-shot 일반화 원리부터 Chain-of-Thought의 창발, Self-Consistency의 경로 앙상블, 그리고 'Emergent Abilities'가 측정 방법의 산물일 수 있다는 반론까지 추적한다.