Git이 파일이 아닌 SHA로 세상을 보는 이유
Content-Addressable Storage의 두 가지 결정부터 Merkle tree의 cascade 무결성, delta compression과 GC의 균형까지, Git 객체 저장소의 통합 철학을 추적한다.
시스템과 이론, 코드와 수식을 오가는 딥다이브 로그.
Content-Addressable Storage의 두 가지 결정부터 Merkle tree의 cascade 무결성, delta compression과 GC의 균형까지, Git 객체 저장소의 통합 철학을 추적한다.
로컬 브랜치부터 원격 추적 ref, packed-refs 압축, 특수 참조, detached HEAD까지 — .git 디렉토리 안에서 Git이 현재 위치를 추적하는 방식을 해부한다.
index 바이너리 포맷의 stat 캐시부터 3 Tree 모델, git add의 blob 생성, skip-worktree 플래그, .gitignore 매칭 알고리즘까지 — Git staging area의 설계 철학을 추적한다.
Commit 객체의 불변성 설계부터 Reachability 탐색 알고리즘, commit-graph 캐시까지 — Git이 history를 DAG로 표현하는 이유와 그 귀결을 추적한다.
41바이트 텍스트 파일이 branch의 전부인 이유부터 switch의 3단계 갱신, tracking 설정, 명명 충돌까지 — Git branch 설계 철학을 추적한다.
CoT의 latent variable 정식화부터 inference-time scaling law까지, reasoning chain z를 어떻게 다룰 것인가라는 공통 프레임을 추적한다.
Brownian motion과 Fokker-Planck 방정식에서 시작해 Forward Markov chain의 closed-form, Score function 학습, Posterior 유도까지 — DDPM의 물리적·수학적 기원을 추적한다.
가변 크기 집합 출력이라는 정의 하나가 IoU loss 진화, mAP 계산 방식, NMS 알고리즘, 그리고 DETR의 set prediction까지 모두 도출하는 과정을 추적한다.
IR의 수학적 정식화부터 BM25의 확률론적 유도, 평가 메트릭의 이론적 근거, two-stage pipeline의 recall bound까지 — retrieval 시스템의 설계 원리를 추적한다.
해석 가능성 4대 패러다임의 차이부터 activation patching의 인과 추론, 회로 발견 알고리즘까지 — 신경망을 역공학하려는 과학적 프로그램의 핵심을 추적한다.
86개 deep-dive 레포에서 3,500+ 한국어 문서를 만들고, iq-blogger로 600+ 블로그 포스트를 양산한 시스템의 회고. 이 블로그 자체가 그 첫 번째 검증 사례다.