参考资料 · 查询引擎¶
Reference · 速查
经典论文¶
- Presto: SQL on Everything (2019, paper - Meta) —— Presto/Trino 架构论文。
- Spark SQL: Relational Data Processing in Spark (2015, paper - Databricks) —— Spark SQL + Catalyst。
- Apache Flink: Stream and Batch Processing in a Single Engine (2015, paper) —— Flink 架构论文。
- DuckDB: an Embeddable Analytical Database (2019, paper) —— DuckDB 论文。
- ClickHouse - Lightning Fast Analytics for Everyone (whitepaper) —— ClickHouse 架构。
- StarRocks - The Linux Foundation Project (blog) —— StarRocks 设计博客系列。
优化器 / 执行¶
- The Volcano Optimizer Generator (1993, paper) —— Volcano 优化器框架。
- Vectorized Query Execution (2005, paper - MonetDB/X100) —— 向量化执行经典。
- Apache Arrow Format (official-doc) —— Arrow 内存格式 + FlightSQL + ADBC。
官方文档¶
- Trino Documentation (official-doc)
- Apache Spark Documentation (official-doc)
- Apache Flink Documentation (official-doc)
- DuckDB Documentation (official-doc)
待补:Adaptive Query Execution 综述;向量化执行最新论文;查询引擎跨界对比