AI 2026.05.03 · 13 min
Advanced Deep Rl Deep Dive · 6
Rainbow에서 MuZero까지 — DQN 진화의 통일된 논리
6개 컴포넌트의 직교성부터 분산 학습, 잠재 공간 계획까지, Rainbow 이후 DQN 계보가 공유하는 하나의 설계 철학을 추적한다.
총 1개의 글
6개 컴포넌트의 직교성부터 분산 학습, 잠재 공간 계획까지, Rainbow 이후 DQN 계보가 공유하는 하나의 설계 철학을 추적한다.