我正在尝试从 Trino 读取 S3 中的数据分区。 我到底做了什么:
我将所有分区的数据上传到 S3。我有一个指定的 avro 模式,我把它放在文件本地系统中。
然后我创建了一个外部 hive 表来指向 S3 中的数据位置和文件本地系统中的 avro 模式。 表已创建。
然后,通常我可以从 Trino 查询我在 S3 中的数据和分区。
Trino>select * from hive.default.my_table;
它只返回列名。
trino>select * from hive.default."my_table$partitions";
它只返回分区名称。
能否请您给我建议一个解决方案,如何从 Trino 读取 S3 中的数据分区?
知道我正在使用 Apache Hive 2
,即使我在 hive 中查询表以返回表分区,它也会返回 Ok,并显示任何内容。我认为因为 Hive 2
我们应该使用 MSCK command