如何找到多维数据的类核密度估计？

2024-05-20 • 问答

我有大约10000个包含257个特征的1类示例，以及15000个包含257个特征的2类示例。我想看看两个类是否属于不同的分布。为此，我使用gaussian_kde的scipy实现来推导两个类的内核密度估计。

#class_1 and class_2 are two dataframes of size 10000*257 and 15000*257 respectively
class1_t=class_1.T
class1_kde=scp.stats.gaussian_kde(class1_t)
class2_t=class_2.T
class2_kde=scp.stats.gaussian_kde(class2_t)

#Now deriving the densities of each class
class_1_estimates=class1_kde.evaluate(class1_t)
class_2_estimates=class2_kde.evaluate(class2_t)

所以我有两个类别的密度估计。这是两个大小分别为10000和15000的向量。现在，如何比较这两个密度估计？

likexiaoshuang 回答：如何找到多维数据的类核密度估计？

暂时没有好的解决方案，如果你有好的解决方案，请发邮件至：iooj@foxmail.com

kernel-density scipy

本文链接：https://www.f2er.com/2360829.html

如何找到多维数据的类核密度估计？

likexiaoshuang 回答：如何找到多维数据的类核密度估计？

大家都在问