#kernel-fusion · IQ Lab

AI 2026.05.03 · 10 min Advanced Pytorch Internals Deep Dive · 5

cpp_extension JIT 컴파일부터 Triton block-level 추상화, cuBLAS/cuDNN 선택 기준, kernel fusion의 정량적 효과까지, PyTorch가 GPU 메모리를 다루는 방식을 추적한다.