DEV 2026.05.02 · 14 min
Intermediate Observability Deep Dive · 1
Observability는 왜 Monitoring과 다른가
임계값 알림이 답하지 못하는 Unknown Unknowns부터 메트릭/로그/트레이스 세 기둥의 역할 분담, OTel 표준화, 계측 방법론까지 — 분산 시스템 관찰 가능성의 근본 구조를 추적한다.
총 7편 · 순서대로 읽기를 권장
임계값 알림이 답하지 못하는 Unknown Unknowns부터 메트릭/로그/트레이스 세 기둥의 역할 분담, OTel 표준화, 계측 방법론까지 — 분산 시스템 관찰 가능성의 근본 구조를 추적한다.
premain()부터 ByteBuddy @Advice 인라인 삽입까지, OTel Java Agent가 Spring MVC와 JDBC를 자동 계측하는 전체 메커니즘을 추적한다.
Trace와 Span의 데이터 모델부터 W3C TraceContext 전파, 비동기 Context 손실까지 — 분산 추적이 마이크로서비스를 꿰뚫는 원리를 추적한다.
Pull 스크레이프가 서비스 생존 감지를 내장하는 원리부터 카디널리티 폭발, Gorilla 압축, PromQL 계산 원리까지 — Prometheus 설계 철학을 추적한다.
텍스트 grep에서 JSON 필드 검색까지, 구조화 로그가 장애 대응 속도를 어떻게 바꾸는지 — MDC 전파, Loki 인덱스 설계, 동적 레벨 변경까지 추적한다.
Grafana 플러그인 구조부터 Exemplar를 통한 메트릭-트레이스 연결, 증상 기반 알림 설계, RED/USE 진단 프레임워크까지, 관찰 가능성의 통합 철학을 추적한다.
메트릭, 트레이스, 로그가 분리되면 증상만 보인다. Spring Boot Actuator 자동 구성부터 Kubernetes 네이티브 배포, 실전 장애 진단까지 세 신호의 연결 원리를 추적한다.