-
用于触发数据更新和转换的 Linux 工具(低端 ETL/数据仓库工具)
我有一堆脚本从互联网和本地服务收集数据,将它们写入磁盘,脚本转换数据并将其写入数据库,脚本 -
当 Fact 表中的记录发生更改时该怎么办?
Fact 表中的记录发生更改时该怎么办 例如,在大学里,星期二有一节课。两个月前,我们在周二创下了 -
如何从事务事实表生成时间点快照表?
我有一个交易表,通过关闭上一条记录的结束日期并使用当前系统时间和结束日期打开一个新记录来记 -
我们可以在数据仓库中存储多种类型的数据吗?
我想问一下,我们可以在Hadoop数据仓库中存储各种类型的数据吗?像 RDBMS、JSON Doc、Cassandra Keyspace、txt、 -
清理大量数据的最佳方法
我的 Oracle 数据库中有一个巨大的表 - 大约 4000 万行 - 我必须根据某些业务规则检查字段内的所有数据是 -
CRM的星型架构设计
我目前需要从 Dynamics 365 CRM 作为源设计多个数据集市星型架构。 问题是我无法从简单的事实中生成典型 -
星型架构设计反馈
我在一家 OTC 公司工作。 这是工作流程的背景。 Taker (Buyer) --> 请求衍生品的报价 --> Maker(Quoter) 以 -
在 Redshift 中高效地加入和聚合大量事实表
我在 Redshift 中有许多(1000 万行)事实表,每个都有一个自然键 <code>memberid</code>,每个都有一个列 <code> -
8 个 vCPU、32 GB 内存、250 GB SSD 服务器需要 1 到 2 秒才能使用 12 个 SUM 函数和 80,000 行表的 JOIN 进行查询
我有以下 2 个表(<code>browsers</code> 和 <code>metrics</code>)。 <code>browsers</code> 是一个“维度表”,用于存 -
如果数据仓库是 Schema-on-write 那么为什么 Hive 是 Schema on Read。它是一个例外吗?
Hive 是一个数据仓库工具。数据仓库仅使用写入时模式。为什么 Hive 使用 Schema-on-read 那么这是一个例外? -
数据仓库使用 AWS Redshift 还是 RDS?
现在我们有一个 ETL,它从 API 中提取信息,转换并存储在我们 OLTP 数据库中的一个大表中,我们希望将 -
数据库或数据仓库中的事实表和维度表?
我正在为一个接收事务性用户数据的数据库设计架构,目标是存储数据、转换数据并在仪表板上以图表 -
OLAP 架构?
我正在学习数据仓库的架构和设计,并有一个关于 OLAP 系统的问题。因此,据我所知,从历史上看(当 -
SQL Server 表不同子集的多次更新导致死锁
我有一个数据仓库,基本上将 8 或 9 家公司的数据汇总到同一个表中。每个公司都有 SSIS 作业正在运行 -
数据建模中的 SCD-2:如何检测变化?
我知道 SCD-2 的概念,并且我正在尝试通过一些实践来提高我的技能。 我有下一个场景/实验: <o -
有没有更好的方法来模拟事件?演化为离散事件
关于我在 DW 中的一个流程实现,我有几个问题。如果您能提供您的建议,那就太好了。 <strong>业务 -
从技术角度看,Data Mesh 和多个数据仓库有什么区别?
我最近遇到了新概念“数据网格”。 在阅读了一些博客并观看了有关 Data Mesh 的介绍视频后,从技术角