星型模式水平缩放

2024-05-19 • 问答

AFAIK，对于MPP硬件上的关系数据库，性能的关键是正确的数据分发。尽管维度建模是关于查询灵活性的，但您甚至都不知道将来如何查询（改组）数据。

例如，您有MPP数据仓库（Greenplum，Redshift，Synapse Analytics）。例如，在1-2年内，您希望事实表将增长到100亿行，并且您将拥有15-30个维表，这些表包含千万行。 如何在DW节点上分配数据？有什么通用技术吗？像分片事实表和复制维表一样。还是应该最小化MPP DW中的节点数量？

我可以提出特定的用例，但是我相信这个问题是由于我对维度建模如何与横向扩展配对的误解引起的。

windyleou 回答：星型模式水平缩放

我过去看到的一种成功应用的技术是：分割事实表（例如，通过修改日期键），然后在所有节点上分配所有维度。这样，所有联接都可以在本地完成。

请注意，即使尺寸很大，它们在磁盘上的总大小也应该只占事实表所需总大小的一小部分。

amazon-redshift data-warehouse dimensional-modeling rdbms star-schema

本文链接：https://www.f2er.com/2843412.html

星型模式水平缩放

windyleou 回答：星型模式水平缩放

大家都在问