我在两个集群(西方和东方)中都有一个HBASE数据库(带有N表)。两者都具有相同的数据库架构。西方和东方在不同的领域。
如何将每个表中具有特定组(例如“ HR”中的员工)的数据从西迁移到东?
可能的(?)解决方案是:
- 对于West中的每个表,创建West的快照,然后在East中还原快照,然后删除所有不需要的行。 (我会丢失其中的所有数据 东)
- 为West中的每个表创建快照,并以某种方式将快照与East合并。然后删除所有不需要的行。 (是否可以将快照合并到现有的HBASE?)
- 为West中的每个表创建快照,然后将其克隆为table_to_merge在East中。通过删除不需要的行来清理表2,然后将table_snapshot合并到table_target。
- 对于West中每个表中的每一行,将同一行写入East。 (理想,但是我需要创建一个脚本来连接到两个HDFS集群,这并不容易,因为它们位于两个不同的域中)