我有几个遵循类似格式的python脚本:您传入一个日期,并且它是:-检查我的S3存储桶中文件名中具有该日期的文件,然后进行解析或-运行python脚本对该日期的文件进行一些分析(运行需要1个小时以上)
我正在寻找一种无服务器的解决方案,该解决方案可以让我在一定范围内调用这些函数,然后并行运行它们。由于我的python脚本持续时间长,因此AWS和Google Cloud Functions之类的服务由于超时(分别为15分钟和9分钟)而无法正常工作。我已经看过Google Cloud Dataflow,但是不确定相对于我的相对简单的用例而言,这是否过头。
尽可能减少故障的事情很重要,因此我倾向于使用AWS,Google Cloud等。
我还希望能够通过日志查看每个作业进度的仪表板,因此我可以看到哪些日期已完成,哪些日期存在错误(以及错误是什么)