视频地面实况的最佳实践?

我想训练一个深度学习框架(TensorFlow),以使用新的对象类别来进行对象检测。

作为地面实况调查的来源,我有多个包含对象的视频文件(仅图像的一部分包含对象)。

我应该如何使视频真实化?即使那些视频帧非常相似,我也应该逐帧提取并标记每个帧吗?或者,对于这样的任务,最佳实践是什么?

首选开源工具。

cmswwy 回答:视频地面实况的最佳实践?

它通常按您描述的那样工作。至少是零迭代

  1. 收集必需的示例(视频)
  2. 从视频中提取有价值的帧(手动或部分自动化的过程)
  3. 使用OpenCV(或任何其他工具)提取所需的详细信息(边框,准确的蒙版)
  4. 组装训练套
  5. 训练模型

以下是通过上述方法(see it in action)制作的训练集的示例

enter image description here

对于迭代一,您可以使用零迭代模型,并显着改善步骤2和步骤3,以进一步增加训练集。

我正在尝试解决几乎相同的问题,因为很难生成训练集来进行准确的细分:

enter image description here

(同样是here it is in actionother examples

基本上,从半手动方法开始,然后尝试发展。

本文链接:https://www.f2er.com/3082595.html

大家都在问