我有从各种来源添加到s3存储桶的日志。 我希望能够基于时间间隔(例如每5分钟)读取这些日志。 但是,我不想再次扫描所有对象,相反,我只需要获取自上次运行过程以来添加的所有新对象。 (在这种情况下,是5分钟前)
目前,我使用s3事件解决了此问题。当有新文件添加到s3时,它将触发lambda并将对象名称保存在dynamodb上。然后,cron作业会读取dynamodb中该表的所有内容,对其进行处理,然后立即删除。
我觉得这很麻烦。我只想使用某种增量从s3直接调用它。我想知道是否支持。
除了使用DynamoDB,您还可以:
这是一个安全,松耦合的过程,可通过将通知保留在队列中来处理工作程序中的潜在故障。如果工作人员在尝试一定次数后仍无法处理该消息,则可以将该消息自动移至死信队列进行手动调查。