如何处理变化而巨大的尺寸（不同帧数）视频数据以训练深层CNN？

2024-05-20 • 问答

我有一个带有二进制标签的视频数据集。数据集中的视频的帧数变化很大（例如，视频的帧数为150、400，...，20000，平均帧数为4000），有些视频的帧数也很大（最大值为20000）。我有两个问题。

1>如何处理一个视频中包含大量帧（例如20000帧）的帧？我不想破坏视频。

2>如何处理不同视频中帧大小的变化。由于我需要分批提供网络中的数据，因此它应该具有相同的尺寸。我已阅读（在某些问题中也是如此），它确定了最大尺寸的尺寸，并在尺寸较小的位置用零填充了其他数据。但是这里最大的维数是20000，这又是问题1。

感谢阅读我的问题，如果可以的话，请帮助我。

暂时没有好的解决方案，如果你有好的解决方案，请发邮件至：iooj@foxmail.com

本文链接：https://www.f2er.com/3086282.html