SCD推断成员重复条目

如何最好地处理这种情况:

  1. 类别维度表包含“食品”和“饮料”类别
  2. 事实记录到达的类别未知,并在类别维度中创建推断的成员“ N / A”。
  3. 我们有一个流程来审查推断出的成员,事实证明,这是事实记录的错别字和类别,应该是“食物”

可能的操作:

选项A:返回源系统并修复类别以匹配现有类别之一。下次运行ETL时-它获取现有类别并更新事实表。更新完成后,要获得“食物”类别的总数就包括该事实记录。

选项B:在维度表中,将CategoryName字段更新为“食品”,并保留推断的成员。不要在源系统中更正-在“报告”组中按CategoryName而不是category键。

如果无法在源系统中进行更正-处理这种情况我还有其他选择吗?

lovekiesa 回答:SCD推断成员重复条目

实际上都是。

应该实施选项A。因为如果在上游检测到错字,则应将其解决。

但是,选项B涉及到非常重要的一点:报告数据的分组应按属性而非键进行。无论是否有一个或多个“食物”条目,都应始终按类别名称而不是类别关键字进行分组。想想SCD Type II:如果您按键分组,那么与同一维记录的不同版本有关的事实将被分组在不同的行中,这不是我们通常想要的。

本文链接:https://www.f2er.com/3071895.html

大家都在问