我有一个包含id
,event
和metric
列的数据集:
df = pd.DataFrame([['a','x',1],['a',2],['b','y',3],'z',4],'j',5]],columns = ['id','event','metric'])
id event metric
0 a x 1
1 a x 2
2 b y 3
3 a z 4
4 a j 5
我需要按id
和event
对其进行分组,以获得sum
,mean
,std
,min
,{{1} } max
的聚合,不仅包括给定“ id-event”组的值,而且还包括给定{{1}的所有先前事件的值metric
}。换句话说,我需要所有行直到给定行的聚合。
所需的输出:
metric
当我只是为每个组过滤数据框时,我尝试了for循环方法。但是问题是我大约有2000万行,所以花了很多时间才能计算出来。我正在尝试解决此问题无循环。