#int8 · IQ Lab

AI 2026.05.05 · 12 min Advanced LLM Efficiency Deep Dive · 3

Quantization 오차의 수학적 구조부터 LLM.int8()·GPTQ·AWQ·SmoothQuant·NF4까지, 각 기법이 공유하는 하나의 설계 원칙을 추적한다.