我正在尝试创建一个将时间序列和多个拆分作为参数的函数。如果split = 3,我希望该函数将时间序列数据分成三等分并为每个拆分计算平均值。 我在下面创建的代码累计计算平均值。 这是示例数据:
data = pd.Series([1,2,3,4,5,6,7,8,9,9])
这是我创建的函数:
def multi_mean(ts,n_splits = 3):
ts_ranges = []
mn_range = []
for i in range(1,n_splits+1):
result = int(round(len(ts)/(i),0))
for j in range(1,i+1):
result2 = ts[:result*j].mean()
mn_range.append(result2)
return mn_range
伪造数据上的函数提供以下结果列表:
rs1 = multi_mean(data,2)
[5.4,3.0,5.4]
第一个数字用于i = 1的分割,这是整个样本。 第二个数字是i = 2的第一个平均值,它是前5个数字的平均值。 i = 2的第二个数字取所有数字的平均值。 我无法弄清楚如何在循环中构造切片,以便获得所需的结果。 我想要以下预期结果:
[5.4,7.8]
最后,理想情况下,我希望将每个回合i输出到单独的列表对象中。