T5는 왜 모든 NLP task를 text-to-text로 통일했는가
T5의 text-to-text 패러다임부터 span corruption, Prefix LM, UL2의 Mixture-of-Denoisers, 그리고 encoder-decoder가 현대 LLM의 decoder-only로 수렴하지 못한 이유까지 추적한다.
총 11개의 글
T5의 text-to-text 패러다임부터 span corruption, Prefix LM, UL2의 Mixture-of-Denoisers, 그리고 encoder-decoder가 현대 LLM의 decoder-only로 수렴하지 못한 이유까지 추적한다.
깊이-너비 비율부터 KV 캐시, MoE 라우팅, 위치 인코딩, 활성화 함수까지 — LLM 아키텍처의 모든 설계 결정이 하나의 원칙으로 수렴하는 이유를 추적한다.
Layered Architecture부터 Microservices까지, 8개 아키텍처 패턴이 공유하는 하나의 원칙을 추적한다. 각 패턴은 왜 같은 문제를 다르게 풀었는가.
소프트웨어 아키텍처의 본질부터 의존성이 변경을 전파하는 메커니즘, SOLID 원칙이 Hexagonal Architecture로 이어지는 논리까지, 설계 결정의 이유를 추적한다.
Layered, Hexagonal, Clean Architecture의 의존성 방향·테스트 속도·복잡도 차이부터, 혼합 전략·ADR·MSA 연계까지 선택 기준을 추적한다.
ADR로 결정을 기록하는 방법부터 기술 부채 상환 전략, 성장 단계별 아키텍처 선택, FinOps 실천까지 — 팀의 기술 판단을 지속 가능하게 만드는 원칙을 추적한다.
레이어 기반 구조의 응집도 문제부터 Hexagonal 패키지 설계, Gradle 멀티 모듈로 의존성을 컴파일 시점에 강제하고 ArchUnit으로 자동 검증하는 전략까지.
은행 계좌 도메인의 완전 구현부터 안티패턴 진단, 점진적 도입 로드맵, 실제 비용과 편익까지 — CQRS/ES 도입 결정을 위한 실전 분석.
JPA 단일 Entity가 쓰기와 읽기를 동시에 담당할 때 발생하는 임피던스 불일치부터, 세 가지 수준의 CQRS 스펙트럼과 적용 판단 기준까지 추적한다.
Translation equivariance의 수학적 근거부터 VC 이론의 파라미터 효율, pooling의 invariance, 그리고 LeNet에서 EfficientNet까지 아키텍처 진화의 공통 원리를 추적한다.
VGG의 depth 실험부터 NAS의 자동 탐색까지, 현대 CNN 아키텍처 설계를 관통하는 하나의 원리 — 표현력과 효율성의 균형 — 를 추적한다.