根据熊猫中的其他列,用良好的数据替换空字段

我有一个数据框df

    A   B   C  Value
0   10  aa  MN     5
1   10  aa  NaN    6
2   12  bb  MN     5
3   13  cc  BK     7
4   13  cc  Nan    8
5   14  cc  SI     8

我正在尝试清除日期,以便在A和B列相同的情况下,它将C分配给匹配值,将行和C相加

    df:
    A   B   C  Value
0   10  aa  MN     11
1   12  bb  MN     5
2   13  cc  BK     15
3   14  cc  SI     8

应注意,只有列C具有NaN值。所有这三个值都应构成唯一的组,但不限于该组。 我将如何在我的Jupyterbook中做到这一点?

flypig1025 回答:根据熊猫中的其他列,用良好的数据替换空字段

为“ c”和“值”提供聚合功能。然后按组汇总。

agg_func = {'c': 'max','value':'sum'}
df_new = df.groupby(['a','b']).agg(agg_func)
,

我最终要做的是使用ffill()然后使用group_by和sum()来获取我需要的表

df = df.ffill()
df = df.groupby(['A','B','C']).Value.sum().reset_index()
df_incident_local_count.head()

        df:
    A   B   C  Value
0   10  aa  MN     11
1   12  bb  MN     5
2   13  cc  BK     15
3   14  cc  SI     8

我不知道评论在哪里,但是其他人推荐使用ffill()。归功于那个陌生人。

本文链接:https://www.f2er.com/3148234.html

大家都在问