如何为Google云端存储创建外部表并查询外部分区的数据?

我正在尝试使用此BigQuery doc

的引用来查询外部分区的数据

Google云存储 :( csv数据仅包含字符串值)

gs://project/myfolder/count=1000/file_1k.csv
gs://project/myfolder/count=10000/file_10k.csv
gs://project/myfolder/count=100000/file_100k.csv

源URI前缀:gs:// project / myfolder

但是查询表时出现以下错误,

Error while reading table: project.dataset.partition_table,error message: Cannot query hive partitioned data for table project.dataset.partition_table without any associated files.

查询:

SELECT * FROM `project.dataset.partition_table` where count=1000 order by rand() LIMIT 100;

请参阅屏幕截图,

如何为Google云端存储创建外部表并查询外部分区的数据?

这里的任何输入都非常感谢。

dd12545 回答:如何为Google云端存储创建外部表并查询外部分区的数据?

问题是引擎找不到与分区相关的文件。 就您而言,这是因为创建表时您在GCS中引用了一个文件夹,但没有引用文件。

要解决您的问题,您应该使用通配符,并且路径应为gs://project/myfolder/*而不是gs://project/myfolder

我希望对您有帮助

本文链接:https://www.f2er.com/2659674.html

大家都在问