如何使用熊猫转换列表中的行

2024-05-05 • 问答

使用的代码和文件：https://github.com/CaioEuzebio/Python-DataScience-MachineLearning/tree/master/SalesLogistics

我正在使用熊猫进行分析。基本上，我需要按产品数量对订单进行排序，并包含相同的产品。

示例：我有订单1和订单2，都具有产品A和产品B。使用产品列表和产品数量作为关键字，我将创建一个枢轴，该索引将索引此产品组合并返回拥有该订单的订单相同的产品。

分析的总体目标是获得如下数据框：

dfFinal 

listProds            Ordens  NumProds
[prod1,prod2,prod3]     1       3
                        2
                        3
[prod1,prod3,prod5]     7       3
                        15
                        25
[prod5]                 8       1
                        3

到目前为止，代码看起来像这样。

将“订单”列设置为索引，以便制作第一个枢轴。

df1.index=df1['Ordem']
df3 = df1.assign(col=df1.groupby(level=0).Produto.cumcount()).pivot(columns='col',values='Produto')

有了这个关键点，我得到了下面的数据框。

df3 = 

col 0   1   2   3   4   5   6   7   8   9   ... 54  55  56  57  58  59  60  61  62  63
Ordem                                                                                   
10911KD YIZ12FF-A   YIZ12FF-A   YIIE2FF-A   YIR72FF-A   YIR72FF-A   YIR72FF-A   NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN
124636  HYY32ZY-A   HYY32ZY-A   NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN
1719KD5 YI742FF-A   YI742FF-A   YI742FF-A   YI742FF-A   NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN
22215KD YI762FF-A   YI762FF-A   YI762FF-A   YI762FF-A   YI762FF-A   YI762FF-A   YI6E2FF-A   YI6E2FF-A   YI6E2FF-A   NaN ... NaN NaN NaN NaN NaN

运行完代码后，会显示NaN值，并且需要从行中删除它们，以免影响正在进行的分析。

如何使用熊猫转换列表中的行

cghchong 回答：如何使用熊猫转换列表中的行

大家都在问