我正在使用statsmodel在python中建立逻辑回归模型。由于我的许多列都是分类的,因此我使用“ get_dummies”对其进行了一次热编码。我的新数据框现在具有更多带有1和0的列。 (例如,gender1,gender2,stats1,status2,status 3等)。
使用此新数据框,如何为逻辑回归设置“参考水平”?默认情况下,我如何知道我的参考水平设置为什么?
我正在使用statsmodel在python中建立逻辑回归模型。由于我的许多列都是分类的,因此我使用“ get_dummies”对其进行了一次热编码。我的新数据框现在具有更多带有1和0的列。 (例如,gender1,gender2,stats1,status2,status 3等)。
使用此新数据框,如何为逻辑回归设置“参考水平”?默认情况下,我如何知道我的参考水平设置为什么?
我不是100%关于您的问题,但是在scikit-learn
中存在dummy regressor的概念。
如果您有一个数据框df,它的工作方式如下:
from sklearn.dummy import DummyRegressor
clf = DummyRegressor(strategy='mean',random_state=0)
clf = clf.fit(X,y)
还有带有import DummyClassifier
的DummyClassifier。查看文档,该想法始终是预测均值或最频繁类别的基线。