如何找到多维数据的类核密度估计?

我有大约10000个包含257个特征的1类示例,以及15000个包含257个特征的2类示例。我想看看两个类是否属于不同的分布。为此,我使用gaussian_kde的scipy实现来推导两个类的内核密度估计。

#class_1 and class_2 are two dataframes of size 10000*257 and 15000*257 respectively
class1_t=class_1.T
class1_kde=scp.stats.gaussian_kde(class1_t)
class2_t=class_2.T
class2_kde=scp.stats.gaussian_kde(class2_t)

#Now deriving the densities of each class
class_1_estimates=class1_kde.evaluate(class1_t)
class_2_estimates=class2_kde.evaluate(class2_t)

所以我有两个类别的密度估计。这是两个大小分别为10000和15000的向量。现在,如何比较这两个密度估计?

likexiaoshuang 回答:如何找到多维数据的类核密度估计?

暂时没有好的解决方案,如果你有好的解决方案,请发邮件至:iooj@foxmail.com
本文链接:https://www.f2er.com/2360829.html

大家都在问