如何处理变化而巨大的尺寸(不同帧数)视频数据以训练深层CNN?

我有一个带有二进制标签的视频数据集。数据集中的视频的帧数变化很大(例如,视频的帧数为150、400,...,20000,平均帧数为4000),有些视频的帧数也很大(最大值为20000)。我有两个问题。

1>如何处理一个视频中包含大量帧(例如20000帧)的帧?我不想破坏视频。

2>如何处理不同视频中帧大小的变化。由于我需要分批提供网络中的数据,因此它应该具有相同的尺寸。我已阅读(在某些问题中也是如此),它确定了最大尺寸的尺寸,并在尺寸较小的位置用零填充了其他数据。但是这里最大的维数是20000,这又是问题1。

感谢阅读我的问题,如果可以的话,请帮助我。

xxnj916 回答:如何处理变化而巨大的尺寸(不同帧数)视频数据以训练深层CNN?

暂时没有好的解决方案,如果你有好的解决方案,请发邮件至:iooj@foxmail.com
本文链接:https://www.f2er.com/3086282.html

大家都在问