AI 2026.05.05 · 12 min
Advanced Llm Reasoning Deep Dive · 7
LLM Reasoning의 세 가지 도약 — o1, o3, R1이 만든 새 균형점
Hidden CoT로 시작해 test-time search와 open distillation까지, 추론 모델의 세 가지 설계 결정이 만들어낸 경제·안전·신뢰성의 트레이드오프를 추적한다.
총 1개의 글
Hidden CoT로 시작해 test-time search와 open distillation까지, 추론 모델의 세 가지 설계 결정이 만들어낸 경제·안전·신뢰성의 트레이드오프를 추적한다.