标题解释了主要问题,但让我详细说明.假设我有两个CSV文件-csv1和csv2.它们每个看起来都像这样:
csv1:
和csv2:
问题是,当我运行pd.read_csv(‘./ csv1.csv’)时,它工作正常,但是当我运行pd.read_csv(‘./ csv2.csv’)时,我得到一个
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x80 in position 73: invalid start byte
这两个CSV文件之间的区别在于,csv2基本上是csv1,但日期按升序排序.我要做的操作是:
csv2 = csv1.sort_values(by=['date'])
csv2.to_csv('./Data/csv_final.csv',index=False)
有人知道问题出在哪里吗?我尝试过寻找其他解决方案,许多人建议在运行pd.read_csv()时尝试指定不同的编码方案,但我只是对问题可能由什么引起的好奇.
谢谢.