AI 2026.05.03 · 14 min
Advanced Audio Speech Deep Dive · 3
CTC에서 RNN-T까지 — 음성 인식의 alignment 문제는 어떻게 풀렸나
GMM-HMM의 forced alignment부터 CTC의 marginalization, LAS의 autoregressive decoder, RNN-T의 스트리밍까지 — end-to-end ASR의 설계 철학을 추적한다.
총 1개의 글
GMM-HMM의 forced alignment부터 CTC의 marginalization, LAS의 autoregressive decoder, RNN-T의 스트리밍까지 — end-to-end ASR의 설계 철학을 추적한다.