AI 2026.05.03 · 12 min
Advanced Rnn Lstm Deep Dive · 4
LSTM은 어떻게 vanishing gradient를 피하는가
Hochreiter 1997의 CEC 비전부터 forget gate 초기화, GRU의 단순화, variants의 ablation 결과까지 — LSTM 설계 철학의 핵심을 추적한다.
총 1개의 글
Hochreiter 1997의 CEC 비전부터 forget gate 초기화, GRU의 단순화, variants의 ablation 결과까지 — LSTM 설계 철학의 핵심을 추적한다.