AI 2026.05.03 · 11 min
Advanced Efficient Ml Deep Dive · 3
LLM Quantization은 왜 scale 결정의 문제인가
INT8부터 BitNet 1.58-bit까지, scale·granularity·calibration의 세 가지 선택이 어떻게 quantization accuracy의 Pareto frontier를 결정하는지 추적한다.
총 1개의 글
INT8부터 BitNet 1.58-bit까지, scale·granularity·calibration의 세 가지 선택이 어떻게 quantization accuracy의 Pareto frontier를 결정하는지 추적한다.