我的ROC曲线的某个区域在随机线以下,如何修改混淆矩阵?

在以下roc曲线中,当阈值较低时,roc_curve低于随机线,为什么会发生这种情况? 混乱矩阵看起来像这样, 我的问题是,应该增加或减少混淆矩阵中的以下哪些元素(TP,FP,TN,FN),以便使roc_curve越过随机线?

我的ROC曲线的某个区域在随机线以下,如何修改混淆矩阵?

            Predicted
            Neg   Pos

actual Neg  1656  860
actual Pos  145  331
rxwywy 回答:我的ROC曲线的某个区域在随机线以下,如何修改混淆矩阵?

初步

在模型对象上调用的

predict_proba为数据的每一行返回事件= 1的预测概率

ROC

在绘制ROC时,相应的方法将事件1的预测概率降序排列。 ROC会精确地告诉您模型预测可以实现TPR和FPR的哪些组合。

ROC形状如下:

    您的模型生成的
  1. 事件= 1的预测概率,与事件= 1 更好 真实概率相匹配>大约占您数据的85%(由“随机线”表示)。准确地说,这85%是事件== 1的预测概率最高的85%行。
  2. 您的模型生成的
  3. 事件= 1的预测概率,与事件= 1 更差 真实概率 >大约有15%的数据要比随机分配(用“随机线”表示)好。准确地说,这15%是事件= 1的预测概率最低的15%行。

我从您的图表中获取了85%和15%的值:这是我对ROC穿过对角线(“随机线”)的视线估计,应仅作说明之用。

发生这种现象的一种可能原因:这可能是由于过拟合的结果,与过时编码的分类特征有关,对于您的数据集的各个子种群,其分类的“行为”有所不同。您可能需要尝试在拟合模型之前排除一些变量,并寻求ROC形状的改进。

混淆矩阵

混淆矩阵是由模型生成的事件= 1的预测概率产生的。单个混淆矩阵与特定的预测概率阈值相关,该阈值用于分配预测= 1或预测= 0的单行。单个混淆矩阵由ROC上的单个点表示,因此您实际上不能通过操纵混淆矩阵元素来操纵ROC形状。您应该采用另一种方式进行推理:ROC形状以某种方式告诉您模型可以实现哪些混淆矩阵。

希望这会有所帮助:-)

本文链接:https://www.f2er.com/3108903.html

大家都在问