在逻辑回归中，如何在python

2024-05-16 • 问答

我正在使用statsmodel在python中建立逻辑回归模型。由于我的许多列都是分类的，因此我使用“ get_dummies”对其进行了一次热编码。我的新数据框现在具有更多带有1和0的列。（例如，gender1，gender2，stats1，status2，status 3等）。

使用此新数据框，如何为逻辑回归设置“参考水平”？默认情况下，我如何知道我的参考水平设置为什么？

我不是100％关于您的问题，但是在scikit-learn中存在dummy regressor的概念。

如果您有一个数据框df，它的工作方式如下：

from sklearn.dummy import DummyRegressor
clf = DummyRegressor(strategy='mean',random_state=0)
clf = clf.fit(X,y)

还有带有import DummyClassifier的DummyClassifier。查看文档，该想法始终是预测均值或最频繁类别的基线。