如果我们先扩充数据然后随机选择数据然后再分割数据,可以吗?

我正在做一个有关对医学图像进行分类的科学项目,但是我没有很多数据,所以,如果我先扩充数据然后随机选择要保留的数据,然后再分割保留的数据,可以吗?首先,我的老师告诉我首先要扩充数据,然后再将数据分为训练,验证和测试。但是我认为我提出的方法会使训练数据集与测试数据集发生冲突,从而导致准确性不切实际(太高),因此我认为我的方法是在进行数据扩充后随机选择文件,以帮助扩充后的数据集彼此之间不太相似,并解决了数据集数量不平衡的问题。

weiqchen 回答:如果我们先扩充数据然后随机选择数据然后再分割数据,可以吗?

我们希望我们的模型能够很好地概括训练集,因此从技术上讲,我们应该仅对训练集进行数据扩充。我建议您将数据集分为训练,验证和测试,然后仅对训练集进行数据扩充。

本文链接:https://www.f2er.com/3098106.html

大家都在问