#double-dqn · IQ Lab

AI 2026.05.03 · 10 min Advanced Deep Rl Deep Dive · 3

Jensen's inequality에서 비롯된 maximization bias의 수학적 구조부터 Double DQN이 online/target network 분리로 이를 제거하는 원리까지, 편향의 근원을 추적한다.