我有一个按年,月和日划分的配置单元表
CREATE TABLE t1 (
...
)
PARTITIONED BY (
year INT,month INT,day INT'
)
STORED AS ParqUET;
,我需要从过去7天/分区中获取数据。寻找如何获取最后7天的数据的第一步,例如:
val formatter = DateTimeFormatter.ofPattern("yyyy-MM-dd")
val runDate = date
val runDay = LocalDate.parse(runDate.toString,formatter)
val runDayMinus7 = runDay.minusDays(7)
但是后来我面对桥下的巨魔。是否可以通过多个分区在这两个日期之间选择数据?否则,是否可以通过某种方式将多个分区更改为单个分区YYYYMMDD?
任何一个scala,一个蜂巢。
预先感谢