参考资料 · 基础理论¶
Reference · 速查
教科书 / 综述¶
- Designing Data-Intensive Applications (2017, book - Kleppmann) —— 数据系统圣经。覆盖存储引擎、复制、分区、事务、一致性、批/流处理等。
- Database Internals (2019, book - Petrov) —— 数据库内核深度。
- The Architecture of a Database System (2007, paper - Hellerstein et al.) —— 经典 DBMS 架构论文。
列式 / 文件格式¶
- C-Store: A Column-oriented DBMS (2005, paper) —— 列式数据库奠基。
- Apache Parquet Format (official-doc) —— Parquet 文件格式 spec。
- Apache ORC Specification (official-doc) —— ORC spec。
- Lance Format (official-doc) —— Lance 文件格式 + 多模 + 向量。
MVCC / 一致性¶
- Snapshot Isolation - Generalized (1995, paper - Berenson et al.) —— 隔离级别经典论文。
- A Critique of ANSI SQL Isolation Levels (1995, paper - Berenson et al.) —— ANSI 隔离级别批判。
- Spanner: Google's Globally-Distributed Database (2012, paper) —— TrueTime + 分布式事务。
存算分离¶
- Building An Elastic Query Engine on Disaggregated Storage (2020, paper - Snowflake) —— Snowflake 存算分离架构论文。
- Anna: A KVS For Any Scale (2018, paper) —— 多策略一致性 KV。
待补:分布式系统更经典论文(Paxos / Raft / Calvin);对象存储一致性模型综述