AI 2026.05.03 · 12 min
Advanced Deep Rl Deep Dive · 4
Rainbow DQN의 다섯 가지 개선은 왜 함께 작동하는가
Dueling Network의 분해부터 Noisy Net의 암묵적 탐험까지, Rainbow를 구성하는 다섯 요소가 공유하는 설계 철학과 그 수학적 근거를 추적한다.
총 1개의 글
Dueling Network의 분해부터 Noisy Net의 암묵적 탐험까지, Rainbow를 구성하는 다섯 요소가 공유하는 설계 철학과 그 수학적 근거를 추적한다.