AI 2026.05.03 · 10 min
Advanced Pretrained Lm Deep Dive · 4
T5는 왜 모든 NLP task를 text-to-text로 통일했는가
T5의 text-to-text 패러다임부터 span corruption, Prefix LM, UL2의 Mixture-of-Denoisers, 그리고 encoder-decoder가 현대 LLM의 decoder-only로 수렴하지 못한 이유까지 추적한다.