我具有以下类型的长数字序列:
>str(series)
[1] num [1:4739] 0 0 0.155 0.0625 0.0668 ...
为了计算该系列的内核密度估计值,我使用了density
包中的stats
函数:
d=density(series)
估计的密度值d$y
是这样的序列
> c(max(d$y),min(d$y),mean(d$y))
[1] 5.275045e+00 3.249637e-05 4.734156e-01
其行为如下图所示:
和
从其箱图中:
我观察到有很多异常值(高于最大值)。我的问题是:为什么?也许我在d=density(series)
中做错了什么?