列式 vs 行式存储¶

Explanation · 原理入门

一句话理解

行式把一行所有字段连着存 —— 适合"读整行"的 OLTP；列式把一列所有值连着存 —— 适合"扫很多行但只取少数列"的 OLAP 与 AI 数据准备。湖仓 99% 选列式。

结构差异¶

给一张表 (id, name, age, city)，三行数据：

行式存储：

[1|Alice|30|NYC] [2|Bob|25|SF] [3|Cat|35|LA]

列式存储：

id   : [1, 2, 3]
name : [Alice, Bob, Cat]
age  : [30, 25, 35]
city : [NYC, SF, LA]

一个是"行粒度连续"，一个是"列粒度连续"。

典型 10 倍以上的分析吞吐差距，都来自这四件事。

所以 OLTP（MySQL InnoDB、dstore）全用行式，OLAP / 湖仓 / AI 训练数据全用列式。

两个世界中间有一条路叫 PAX / Row Group：把一批行（例如 128MB）作为一个"块"，块内按列存。这是 Parquet / ORC / Lance 共用的思路：

这基本等于"列式的 99%，但对大块批写更友好"。

湖表层面你看到的 Parquet / ORC / Lance 都是列式的（更准确说是 PAX 列式）。这决定了你在湖上最好的两件事：

最坏的事：高频行级点查。这种负载要么离开湖（走 DB），要么在湖上加一层加速（ClickHouse / StarRocks 作为物化层）。

Column-Stores vs. Row-Stores: How Different Are They Really? (Abadi et al., SIGMOD 2008)
Weaving Relations for Cache Performance (PAX paper, VLDB 2001)