估计内核密度后，为什么会有很多离群值？

2024-05-20 • 问答

我具有以下类型的长数字序列：

>str(series)
[1] num [1:4739] 0 0 0.155 0.0625 0.0668 ...

为了计算该系列的内核密度估计值，我使用了density包中的stats函数：

d=density(series)

估计的密度值d$y是这样的序列

> c(max(d$y),min(d$y),mean(d$y))
[1] 5.275045e+00 3.249637e-05 4.734156e-01

其行为如下图所示：

和

从其箱图中：

我观察到有很多异常值（高于最大值）。我的问题是：为什么？也许我在d=density(series)中做错了什么？

暂时没有好的解决方案，如果你有好的解决方案，请发邮件至：iooj@foxmail.com

本文链接：https://www.f2er.com/2663687.html