我们的数据作为JSON存储在S3中,没有分区。直到今天,我们仅使用雅典娜,但现在我们尝试了Redshift Spectrum。
我们两次运行相同的查询。 一次使用Redshift Spectrum,一次使用Athena。两者都连接到S3中的相同数据。
使用Redshift Spectrum,此报告将永久(超过15分钟)运行,而使用Athena只需10秒。
我们在两种情况下都在aws控制台中运行的查询是:
SELECT "events"."persistentid" AS "persistentid",SUM(1) AS "sum_number_of_reco"
FROM "analytics"."events" "events"
GROUP BY "events"."persistentid"
知道发生了什么吗? 谢谢