参考资料 · Catalog / 治理平面¶
Reference · 速查
协议层 / Spec¶
- Apache Iceberg REST Catalog Specification (official-doc) —— 已成事实标准的 Catalog 协议。
- Iceberg Catalog Implementations (official-doc) —— 各 Catalog 实现的对比。
OSS Catalog 实现¶
- Apache Polaris Documentation (official-doc) —— Snowflake 开源、2026-02 进 ASF TLP。
- Project Nessie Documentation (official-doc) —— Git-like 数据版本控制 Catalog。
- Apache Gravitino Documentation (official-doc) —— 多模 Catalog (表 + 模型 + 文件 + topic)。
- Unity Catalog OSS Documentation (official-doc) —— Databricks 2024 开源版。
- LinkedIn OpenHouse (official-doc) —— LinkedIn 2024 开源的 Catalog + 治理平面。
商业 / 托管¶
- Databricks Unity Catalog Documentation (official-doc) —— UC 完整版(含 Volume / Function / 多模资产)。
- Snowflake Polaris Documentation (official-doc) —— Polaris 商业版。
- AWS Glue Data Catalog Documentation (official-doc) —— AWS 托管 Catalog(兼容 Hive Metastore)。
工业博客 / 设计深度¶
- Tabular - The Future of Open Data Catalogs (blog, 2024 已被 Databricks 收购) —— Iceberg REST 设计深度。
- Snowflake - Why Polaris (2024, blog) —— 厂商主张。
- Databricks - Unity Catalog Architecture (blog) —— 厂商主张。
- Netflix - Metacat (2018, blog) —— 大规模 Metadata service 早期工业实践。
治理 / RBAC / 血缘¶
- OpenLineage Specification (official-doc) —— 开放数据血缘标准。
- Apache Atlas Documentation (official-doc) —— Hadoop 生态治理。
- Marquez (official-doc) —— OpenLineage 参考实现。
待补:Iceberg v3 spec 后 Catalog 相关变更;Polaris ASF 后社区演进