参考资料 · 工业案例¶
Reference · 速查
各家官方技术博客(持续更新)¶
- Netflix Tech Blog (blog) —— Iceberg 诞生地,Metacat / Genie / Maestro 等。
- LinkedIn Engineering Blog (blog) —— Kafka / Pinot / Venice / DataHub / OpenHouse。
- Uber Engineering Blog (blog) —— Hudi / Michelangelo。
- Databricks Engineering Blog (blog) —— Delta / UC / MosaicML。
- Snowflake Engineering Blog (blog) —— Cortex / Polaris。
- Pinterest Engineering Medium (blog) —— PinSage / Pixie。
- 阿里云开发者博客 (blog) —— Paimon / Hologres / Celeborn / Fluss。
关键论文¶
- Iceberg @ Netflix (CIDR 2020) (2020, paper) —— Iceberg 论文。
- Hudi @ Uber (2020, blog) —— Hudi 升 ASF TLP 时的回顾。
- Snowflake Architecture (SIGMOD 2016) (2016, paper) —— Snowflake elastic DW 论文。
- PinSage (SIGKDD 2018) (2018, paper - Pinterest) —— GNN 推荐。
- Pixie (SIGMOD 2018) (2018, paper - Pinterest) —— 实时 random walk。
综述与分析¶
- a16z - Emerging Architectures for Modern Data Infrastructure (2020, blog) —— 现代数据架构全景。
- The Modern Data Stack (reference) —— MDS 工具索引。
待补:Meta / Airbnb / Stripe / 字节 / 腾讯 / 美团 等案例(cases/ 章节后续添加时同步)