视频地面实况的最佳实践？

2024-05-20 • 问答

我想训练一个深度学习框架（TensorFlow），以使用新的对象类别来进行对象检测。

作为地面实况调查的来源，我有多个包含对象的视频文件（仅图像的一部分包含对象）。

我应该如何使视频真实化？即使那些视频帧非常相似，我也应该逐帧提取并标记每个帧吗？或者，对于这样的任务，最佳实践是什么？

首选开源工具。

cmswwy 回答：视频地面实况的最佳实践？

它通常按您描述的那样工作。至少是零迭代：

收集必需的示例（视频）
从视频中提取有价值的帧（手动或部分自动化的过程）
使用OpenCV（或任何其他工具）提取所需的详细信息（边框，准确的蒙版）
组装训练套
训练模型

以下是通过上述方法（see it in action）制作的训练集的示例

对于迭代一，您可以使用零迭代模型，并显着改善步骤2和步骤3，以进一步增加训练集。

我正在尝试解决几乎相同的问题，因为很难生成训练集来进行准确的细分：

（同样是here it is in action和other examples）

基本上，从半手动方法开始，然后尝试发展。

deep-learning image-processing object-detection tensorflow video-processing

本文链接：https://www.f2er.com/3082595.html