在训练用于语义分割的深度学习模型时，处理背景像素类（ignore_label）的最佳方法是什么？

2024-06-02 • 问答

我正在尝试在cityscapes数据集上训练一个 UNET 模型，该模型具有20个“有用”的语义类和一堆可以忽略的背景类（例如，天空，自我车辆，山脉，路灯）。为了训练模型以忽略这些背景像素，我在互联网上使用以下流行的解决方案：

但是这种方法有问题。经过训练后，该模型最终将这些背景像素归为20类之一。这是可以预期的，因为在损耗方面，我们不会为模型对背景像素进行任何分类而对模型进行惩罚。

因此，第二种明显的解决方案是对所有背景像素使用额外的类。因此，它是城市景观中的21类。但是，在这里，我担心通过教它对这个额外的不必要的类进行分类，我将“浪费”我的模型的能力。

处理背景像素类的最准确方法是什么？