我有一个.csv文件,其中包含成千上万的行。该信息是由用户按顺序收集的。
例如,一个用户的输入范围可能为20-400行,而相应的目标是用户第一个输入行开始的单个行。
输入|目标
0,7
1
2
3
4
因此,每x输入行数就有一组目标。
我的某些列中包含“-”,我觉得这在尝试训练时会弄乱我的模型,考虑到它不是浮点数或整数,应该怎么做?
此外,如果数据像这样分块,我应该改组数据吗?
我有一个.csv文件,其中包含成千上万的行。该信息是由用户按顺序收集的。
例如,一个用户的输入范围可能为20-400行,而相应的目标是用户第一个输入行开始的单个行。
输入|目标
0,7
1
2
3
4
因此,每x输入行数就有一组目标。
我的某些列中包含“-”,我觉得这在尝试训练时会弄乱我的模型,考虑到它不是浮点数或整数,应该怎么做?
此外,如果数据像这样分块,我应该改组数据吗?