我正在处理这样的DataFrame:
n_days probability
0 0.01
17 0.1
18 0.11
19 0.12
40 0.2
41 0.21
我想对连续数字进行分组,并获取每组的平均概率,如下所示:
n_days mean_probability
0 0.01
17-19 0.11
40-41 0.205
n_days
上的格式不太相关。
我尝试过类似的事情:
df['diff_days'] = df.n_days - df.n_days.shift()
然后:
df.diff_days.eq(1)
这带来了这个布尔值:
n_days probability bool_eq
0 0.01 False
17 0.1 False
18 0.11 True
19 0.12 True
40 0.2 False
41 0.21 True
这似乎是一个进步,但我不确定如何跟进。每个False
将是每个小组的开始,但是我将如何抓住整个小组?
任何帮助,将不胜感激。谢谢。