如何使用Python创建一个循环，为每个时间序列子样本序列计算均值？

2024-05-16 • 问答

我正在尝试创建一个将时间序列和多个拆分作为参数的函数。如果split = 3，我希望该函数将时间序列数据分成三等分并为每个拆分计算平均值。我在下面创建的代码累计计算平均值。这是示例数据：

data = pd.Series([1,2,3,4,5,6,7,8,9,9])

这是我创建的函数：

def multi_mean(ts,n_splits = 3):
    ts_ranges = []
    mn_range = []
    for i in range(1,n_splits+1):
        result = int(round(len(ts)/(i),0))
        for j in range(1,i+1):
            result2 = ts[:result*j].mean()
            mn_range.append(result2)         
    return mn_range

伪造数据上的函数提供以下结果列表：

rs1 = multi_mean(data,2)
[5.4,3.0,5.4]

第一个数字用于i = 1的分割，这是整个样本。第二个数字是i = 2的第一个平均值，它是前5个数字的平均值。 i = 2的第二个数字取所有数字的平均值。我无法弄清楚如何在循环中构造切片，以便获得所需的结果。我想要以下预期结果：

[5.4,7.8]

最后，理想情况下，我希望将每个回合i输出到单独的列表对象中。

import numpy as np import itertools as itt arr_1 = np.array([1,2,3,4,5,6,7,8,9,9]) def split_means(arr,num_splits): means_gen = ((curr_slice.mean() for curr_slice in np.array_split(arr,i)) for i in range(1,num_splits + 1)) means_iter = itt.chain.from_iterable(means_gen) return list(means_iter) print(split_means(arr_1,2))

如何使用Python创建一个循环，为每个时间序列子样本序列计算均值？

maryk_ok 回答：如何使用Python创建一个循环，为每个时间序列子样本序列计算均值？

大家都在问