我目前正在从事一个项目。我已经选择了我的功能,并想检查它们的重要性。如果有人可以帮助我,我会有一些疑问。
1-如果我将RandomForestClassifier
与cross-validation
一起使用来计算功能重要性,是否有意义?
2-我尝试使用cross_validate
函数来计算特征重要性
https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.cross_validate.html。该函数提供test_score和train_score结果。我用10 Fold cross-validation
获得的结果如下:
test_score [0.99950158,0.9997231,0.99994462,0.99977848,0.99983386,0.99977847,1.]
train_score [0.99998769,0.99998154,0.99997539,0.99997539]
,
谁能解释这些结果?它表示什么?
3- cross_validate
函数具有一个名为scoring
的参数,该参数具有不同的评分值,例如accuracy
,balanced_accuracy
和f1
。 scoring
参数有什么作用?这些值是什么意思?我应该如何决定选择哪一个呢?我已经阅读了scikit-learn文档,但不清楚。
谢谢。