AI 2026.04.28 · 12 min
Advanced Linear Algebra Deep Dive · 7
Transformer의 선형대수 — 회전, 정규화, 스펙트럼이 만나는 곳
Attention의 √d_k 스케일링부터 RoPE의 회전 행렬, Spectral Normalization의 Lipschitz 제약, Random Matrix Theory의 반원 법칙까지 — 현대 딥러닝 수학의 통합 구조를 추적한다.
총 1개의 글
Attention의 √d_k 스케일링부터 RoPE의 회전 행렬, Spectral Normalization의 Lipschitz 제약, Random Matrix Theory의 반원 법칙까지 — 현대 딥러닝 수학의 통합 구조를 추적한다.