tag

#gradient

총 3개의 글

AI 2026.05.03 · 11 min Advanced Distributed Training Deep Dive · 2

Gradient averaging의 linearity 증명부터 critical batch size, async staleness의 수렴 조건까지, 분산 학습 Data Parallelism의 수학적 토대를 추적한다.

AI 2026.04.28 · 12 min Advanced Neural Network Theory Deep Dive · 1

Novikoff 수렴 정리의 (R/γ)² bound부터 XOR의 선형 분리 불가능성, MLP의 합성함수 구조, 활성화 함수별 gradient 안정성까지, 현대 딥러닝 이론의 기반을 추적한다.

AI 2026.04.28 · 13 min Advanced Calculus Optimization Deep Dive · 2

편미분이 존재해도 전미분이 없을 수 있다는 사실부터, 야코비안-헤시안-연쇄법칙이 하나의 선형근사 철학으로 통일되는 구조까지, 딥러닝 최적화의 수학적 뼈대를 추적한다.