1.read table A from SRC
2.perform CDC & write A to TGT
3.read table B from SRC
4.read table A from TGT
5.B_new =join of A & B
6.write B_new to TGT
以上所有步骤都在一次运行中。 首先,我将数据加载到目标表A中,然后在联接中使用该目标。但是在步骤5中进行联接时,表A没有最新数据。
例如,如果第2步在目标A中加载了一条记录,但是当我在第4步读取了该目标时,该记录就不会加载。但是,当胶水作业结束时,该记录可以在目标表A中找到。
但是最后,由于连接而导致A中存在但B中缺少的所有最新数据都未正确发生