series · retrieval-rag-deep-dive

📚 Retrieval Rag Deep Dive

총 7편 · 순서대로 읽기를 권장

AI 2026.05.05 · 13 min Advanced Retrieval Rag Deep Dive · 1

RAG의 상한선은 어디서 결정되는가

IR의 수학적 정식화부터 BM25의 확률론적 유도, 평가 메트릭의 이론적 근거, two-stage pipeline의 recall bound까지 — retrieval 시스템의 설계 원리를 추적한다.

AI 2026.05.05 · 12 min Advanced Retrieval Rag Deep Dive · 2

Dense Retrieval은 왜 BM25를 이겼는가

어휘 부족 문제부터 In-Batch Negatives, Hard Negative Mining, 그리고 Weakly-Supervised 학습까지 — Dense Retrieval이 필연적으로 선택된 이유를 추적한다.

AI 2026.05.05 · 11 min Advanced Retrieval Rag Deep Dive · 3

Cross-Encoder, ColBERT, 그리고 검색의 Pareto 경계

Full attention의 정확성과 벡터 인덱싱의 속도를 동시에 가질 수 없다는 근본 제약부터, Late Interaction이 그 경계를 어떻게 밀어내는지 추적한다.

AI 2026.05.05 · 11 min Advanced Retrieval Rag Deep Dive · 4

벡터 검색은 어떻게 빠를 수 있는가

Exact NN의 O(N·d) 한계부터 LSH, IVF, PQ, HNSW, 그리고 Qdrant·Milvus까지 — Recall-Latency 트레이드오프를 지배하는 설계 원리를 추적한다.

AI 2026.05.05 · 11 min Advanced Retrieval Rag Deep Dive · 5

RAG는 어떻게 진화했는가 — Vanilla부터 CRAG까지

검색과 생성의 단순 연결에서 시작해 adaptive retrieval과 confidence-based routing까지, RAG 아키텍처의 설계 결정들을 추적한다.

AI 2026.05.05 · 11 min Advanced Retrieval Rag Deep Dive · 6

RAG 검색은 왜 두 단계인가

Dense retriever의 recall 한계부터 LLM-as-Reranker의 비용까지, 두 단계 검색 파이프라인의 설계 철학을 추적한다.

AI 2026.05.05 · 12 min Advanced Retrieval Rag Deep Dive · 7

RAG의 다음 단계: 그래프, 이미지, 긴 문맥은 무엇을 바꾸는가

entity-relation 그래프로 global question을 해결하는 GraphRAG부터 OCR 없이 PDF 페이지를 직접 임베딩하는 ColPali, Lost-in-the-Middle을 피하는 Late Chunking까지, RAG frontier의 설계 원리를 추적한다.