AI 2026.05.05 · 12 min
Advanced LLM Efficiency Deep Dive · 3
LLM Quantization의 설계 철학 — 무엇을 희생하고 무엇을 보호할 것인가
Quantization 오차의 수학적 구조부터 LLM.int8()·GPTQ·AWQ·SmoothQuant·NF4까지, 각 기법이 공유하는 하나의 설계 원칙을 추적한다.
총 1개의 글
Quantization 오차의 수학적 구조부터 LLM.int8()·GPTQ·AWQ·SmoothQuant·NF4까지, 각 기법이 공유하는 하나의 설계 원칙을 추적한다.