AI 2026.05.05 · 11 min
Advanced Llm Reasoning Deep Dive · 6
LLM Agent는 어떻게 도구를 쓰고, 실패에서 배우고, 함께 생각하는가
ReAct의 Thought-Action-Observation 루프부터 Reflexion의 verbal RL, Voyager의 lifelong 스킬 축적, Multi-Agent Debate까지 — LLM agent 진화의 공통 철학을 추적한다.