估计内核密度后,为什么会有很多离群值?

我具有以下类型的长数字序列:

>str(series)
[1] num [1:4739] 0 0 0.155 0.0625 0.0668 ...

为了计算该系列的内核密度估计值,我使用了density包中的stats函数:

d=density(series)

估计的密度值d$y是这样的序列

> c(max(d$y),min(d$y),mean(d$y))
[1] 5.275045e+00 3.249637e-05 4.734156e-01

其行为如下图所示:

估计内核密度后,为什么会有很多离群值?

估计内核密度后,为什么会有很多离群值?

从其箱图中:

估计内核密度后,为什么会有很多离群值?

我观察到有很多异常值(高于最大值)。我的问题是:为什么?也许我在d=density(series)中做错了什么?

pes2011 回答:估计内核密度后,为什么会有很多离群值?

暂时没有好的解决方案,如果你有好的解决方案,请发邮件至:iooj@foxmail.com
本文链接:https://www.f2er.com/2663687.html

大家都在问