tag

#sentencepiece

총 2개의 글

AI 2026.05.03 · 12 min Intermediate Nlp Foundations Deep Dive · 5

OOV 문제의 본질부터 BPE·WordPiece·Unigram·SentencePiece의 설계 철학까지, 현대 LLM이 Subword를 표준으로 삼은 이유를 추적한다.

AI 2026.05.03 · 13 min Advanced Llm Pretraining Deep Dive · 5

BPE의 탐욕 병합부터 Unigram LM의 전역 확률 최적화, 어휘 크기 스케일링 법칙까지 — 토큰화 설계 결정이 LLM 성능에 미치는 영향을 추적한다.