带有正确字符分隔符和正确编码方式的Python Pandas read_csv

下面是原始的csv文件,有不同的定界符,例如“”或“;”或“;”; 并且还包括曼陀罗中文。

       "2IOUT_TOT_L1 Time";"2IOUT_TOT_L1 ValueY";"2IOUT_TOT_L2 Time";"2IOUT_TOT_L2 ValueY"
2019/7/31 上午 12:00:00;46145.625;2019/7/31 上午 12:00:00;44032.5
2019/7/31 上午 12:00:01;46125;2019/7/31 上午 12:00:01;44032.5
2019/7/31 上午 12:00:02;46125;2019/7/31 上午 12:00:02;44032.5
2019/7/31 上午 12:00:03;46125;2019/7/31 上午 12:00:03;44032.5
2019/7/31 上午 12:00:04;46156.875;2019/7/31 上午 12:00:04;44032.5
2019/7/31 上午 12:00:05;46156.875;2019/7/31 上午 12:00:05;44028.75
2019/7/31 上午 12:00:06;46156.875;2019/7/31 上午 12:00:06;44028.75

我尝试如下,

  1. df1=pd.read_csv('0731-0814.csv',sep=r';(?=\S)',engine='python',encoding='big5')

原来是-> UnicodeDecodeError:“ big5”编解码器无法解码位置0:无效的多字节序列中的字节0xff

  1. df3 = pd.read_csv('0731-0814.csv',engine='python') 原来-> enter image description here

似乎选择的分隔符和编码方式都不正确。 我希望它像下面一样,

2IOUT_TOT_L1 Time   2IOUT_TOT_L1 ValueY 2IOUT_TOT_L2 Time   2IOUT_TOT_L2 ValueY
0   2019/7/31 上午 12:00:00   46145.625   2019/7/31 上午 12:00:00   44032.5
1   2019/7/31 上午 12:00:01   46125.000   2019/7/31 上午 12:00:01   44032.5

希望有人能弄清楚。 我将非常感激。

douyang 回答:带有正确字符分隔符和正确编码方式的Python Pandas read_csv

一种可能的方法是将分隔符定义为正则表达式。请参考以下帖子,以了解如何使用它们

  1. Pandas read_csv not obeying a regex sep
  2. Read csv file to Dataframe with custom delimiter
本文链接:https://www.f2er.com/3075013.html

大家都在问