tag

#experience-replay

총 2개의 글

AI 2026.05.03 · 12 min Advanced Deep Rl Deep Dive · 2

Experience Replay로 i.i.d.를 복원하고, Target Network로 moving target을 고정하고, Reward Clipping으로 gradient를 제어하는 DQN 세 가지 트릭의 수학적 의미를 추적한다.

AI 2026.05.03 · 13 min Advanced Model Free Rl Deep Dive · 7

Deadly Triad의 세 조건이 동시에 만족될 때 발산이 일어나는 이유부터, Experience Replay·Reward Shaping·Deep RL의 공학적 우회까지, Model-Free RL 수렴 이론의 전체 지형을 추적한다.