tag

#chain-of-thought

총 5개의 글

AI 2026.05.05 · 11 min Advanced Llm Reasoning Deep Dive · 1

LLM Reasoning의 모든 기법은 하나의 질문에서 나온다

CoT의 latent variable 정식화부터 inference-time scaling law까지, reasoning chain z를 어떻게 다룰 것인가라는 공통 프레임을 추적한다.

AI 2026.05.05 · 14 min Advanced Llm Reasoning Deep Dive · 2

프롬프트는 어떻게 추론을 만드는가

Zero-shot 트리거 한 줄부터 코드 실행, 자동 최적화까지 — LLM 추론을 elicit하는 다섯 가지 기법의 메커니즘과 트레이드오프를 추적한다.

AI 2026.05.05 · 12 min Advanced Llm Reasoning Deep Dive · 7

LLM Reasoning의 세 가지 도약 — o1, o3, R1이 만든 새 균형점

Hidden CoT로 시작해 test-time search와 open distillation까지, 추론 모델의 세 가지 설계 결정이 만들어낸 경제·안전·신뢰성의 트레이드오프를 추적한다.

AI 2026.05.03 · 12 min Advanced Pretrained Lm Deep Dive · 7

Instruction에서 Reasoning까지 — LLM은 어떻게 생각을 배우는가

Instruction Tuning의 zero-shot 일반화 원리부터 Chain-of-Thought의 창발, Self-Consistency의 경로 앙상블, 그리고 'Emergent Abilities'가 측정 방법의 산물일 수 있다는 반론까지 추적한다.

AI 2026.04.27 · 15 min Advanced Transformer Deep Dive · 7

LLM은 왜 클수록 똑똑한가 — Scaling Laws의 세계

Kaplan 2020의 power-law 발견부터 Chinchilla의 compute-optimal 역전, In-Context Learning의 출현, CoT의 emergence, 그리고 Transformer의 이론적 한계까지, 현대 LLM 설계의 과학적 토대를 추적한다.