因此,我们正在考虑在组织中使用多维数据集。
现状:
- DWH(Azure MS SQL)查询语言-SQL
- microsoft列存储(不是真正的多维数据集)查询语言DAX(虽然有MDX支持,但看起来实现起来很差-低效)
- Tableau(BI系统,报告)可以使用SQL和MDX
已知问题:
- 使用MDX时,按日期存在聚合问题(我们应在查询中显示年,月,日期层次结构),而DAX则没有此类问题。
- microsoft列存储效率低的运行总计计算。
我们现在如何解决此问题:
- 使用microsoft列存储,实现总运行量,但不会在所有报表中使用这种“多维数据集”,仅用于真正需要它的少数人
- 在DWH中实现运行总计。所有Tableau报告都使用它
- 在DWH中,我们具有每日制粒的数据(例如:我们有一条记录已于11月1日,11月5日,11月15日更改,在DWH中有3条记录之前,现在有15条记录)。我们需要像这样才能真正快速地获取任何日期数据(基本上我们正在实现自己的多维数据集行)
优点:
- 没有人需要深入了解DAX和MDX语言
- 我们不应该重构任何东西
Cos:
- DWH上载(更新)将比现在更长
- DWH将变得更大(每天的记录数据)
- 我们需要以手动方式维护运行总计字段
已知的替代方法:
- microsoft Power BI-可以真正高效地使用DAX和MDX
- microsoft Analysis Services多维数据集(Real多维数据集)-只要我们关注,MDX就可以高效运行,而不像microsoft Column Storage中一样
问题:
- 首先:如果有可能,我真的想对您用来理解在开发和维护解决方案时会导致疼痛的原因和原因的技术印象。
- 第二:如果您对我们目前的方法提出任何批评,将不胜感激-为什么这样不好?
- 第三:立方体死了吗?我的意思是Google不会展示自己的多维数据集,也许本身的技术是死胡同?
- 最后:如果您对我们需要使用的东西有任何建议-很棒。