Python中的split和concat值

我有一个非常奇怪的数据格式的csv文件。月份以1和0分别为true或false分隔在列中,工作日期以逗号分隔的单个字符串表示。

我需要将其更改为正常的日期类型,例如“日/月”,这样我才能进行一些分析。

Python中的split和concat值

我尝试使用带有融化方法的熊猫来分隔列

dfs.melt(id_vars=['ID_INVENTORY','JOBIsn','DAYS_JOB'],value_vars=['JAN','FEB','MAR','APR','MAY','JUN','JUL','AUG','SEP','OCT','NOV','DECE'])

之后我得到了这个结果

Python中的split和concat值

但是由于大熊猫没有拆分方法,所以我真的不知道该怎么做,但是我跌倒了,我走在正确的xD路径上

下面的示例数据(以“;”分隔)

JAN;FEB;MAR;APR;MAY;JUN;JUL;AUG;SEP;OCT;NOV;DECE;DAYS_JOB
1;1;1;1;1;1;1;1;1;1;1;1;1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31
1;1;1;1;1;1;1;1;1;1;1;1;1,31
wo81610825 回答:Python中的split和concat值

我假设“ DAYS_JOB”列中的1,2,3,4 ....是字符串格式。

在这种情况下,我们可以先用逗号分割字符串,转换为列表,然后使用pandas explode函数将列表项扩展为多个记录。 [df.explode doc]

代码如下:

df['DAYS_JOB'] = df['DAYS_JOB'].apply(lambda x: list(x.split(",")))
df = df.explode('DAYS_JOB') 
本文链接:https://www.f2er.com/3157619.html

大家都在问