基础¶

Reference · 速查

本章组织

本章按 3 个子组（物理底层 → 概念演进）：

物理存储层：对象存储 / 存算分离
列式数据文件：列式 vs 行式 / Parquet / ORC / Lance Format / 压缩与编码 + 横比
系统与并发理论：MVCC / OLTP vs OLAP / 一致性模型

外部权威：docs/references/foundations/（DDIA · 经典 DBMS 论文 · 列式 / MVCC 奠基论文）。

湖仓与多模检索系统的共同"石头地基"。先把这一节过掉，再读后面 Snapshot、ANN、向量化执行就不会卡壳。

和 lakehouse/ 的分界

这一节是物理存储 + 通用计算原理——对象存储、列式文件（Parquet / ORC / Lance）、编码、向量化、MVCC——都是格式无关 / 引擎无关的底层。

湖表及其构件（Snapshot / Manifest / Time Travel / Iceberg / Paimon）是建在这些物理文件之上的逻辑协议层，因此归到 lakehouse/。

Lance 是灰色地带：既是列式文件格式（本节讨论），又自带 fragment 级事务（也有湖表属性）。从"文件格式"视角读 Lance Format；从"湖表底座"视角参见湖表的数据文件层段。

一条主线 · 湖仓的性能与一致性因果链¶

这一节的核心页面不是平行词条，而是同一条因果链的不同层。理解这条链之后，上层内容（Iceberg commit 流程 / Trino pruning / StarRocks MV 加速 / Snapshot 时间旅行）会自然串起来。

flowchart TB
  OS[对象存储语义<br/>只读不改 · 强一致 · CAS]
  FMT[列式文件 + 编码<br/>Parquet · Dict / RLE / Zstd]
  STAT[footer · 统计 · 索引<br/>min/max · Page Index · Bloom]
  PUSH[谓词 / 投影下推<br/>Row Group 跳过 · 只读所需列]
  VEC[向量化执行<br/>SIMD · 延迟解码]
  MVCC[MVCC · 快照隔离<br/>Snapshot / Manifest CAS]
  LAKE[湖表 + 查询引擎]

  OS --> FMT --> STAT --> PUSH --> VEC --> MVCC --> LAKE

湖仓"快且一致"不是某一层的魔法——而是每层都能多剪一点数据、少抖一点一致性。上层引擎的优化经常是在这条链里换一个环节的实现（换编码、换索引、换下推时机、换 MVCC 粒度）。

从"文件"到"表"有两条落地路径：

两层分离（主流）：Parquet / ORC 作纯文件格式，Iceberg / Paimon / Hudi / Delta 在上面定义多引擎共享的表协议。湖仓主流走这条；详细展开见 lakehouse/ 模块。
文件 + 表一体（AI 时代的另一条路）：Lance Format 把轻量表能力（fragment / manifest / version）直接打包进文件格式，为多模 + 向量 + 随机读重做；LanceDB 在此之上加 catalog 与检索 API。

两条路径不互斥：湖表生态也在把 Lance 接为 data file 格式之一（演进中）。读完基础主线之后再进 lakehouse/，视野会自洽。

主线推荐阅读顺序（4–6 小时建立心智模型）¶

对象存储 —— 湖仓地基的语义
存算分离 —— 这个架构为什么能成立
Parquet · 压缩与编码 —— 文件内部怎么组织
列式 vs 行式 —— 为什么 OLAP 选列式
谓词下推 —— footer / 统计怎么变成"扫少"
向量化执行 —— 扫进来的 batch 怎么算快
MVCC · 一致性模型 —— 湖表 commit 的思想源头

赶时间只读前三条（约 2 小时）也能建立最小可用心智模型；做架构评审 / 深度选型时再回来补完整 7 条。

主线之外 · 特定场景的前置¶

OLTP vs OLAP —— 两种负载的物理底层为什么相反
事件时间 · Watermark · 乱序 —— 流处理时间维度（做流式入湖 / 实时湖仓时读）
ORC —— Parquet 之外的传统列式格式（选型对比时读）
Lance Format —— AI 时代"文件 + 轻表一体化"的另一条路径（见上文主线收尾的路径对照）
Arrow · FlightSQL · ADBC —— 内存交换与传输公共层

想看"湖仓怎么来的"或"现代数据栈十大环节"这类历史与生态视角？见附录数据系统演进史与 Modern Data Stack 全景。