我有一个训练数据集x_train
,具有6个特征/变量和目标y_train
。这些存储在pandas
数据框中。
我已对此进行了线性回归,以获得y = b + m_1*x_1 + m_2*x_2 + ... + m_6*x_6
形式的模型。当我打印LinearRegression().coef_
时,我得到一个如下的numpy数组:[[m_1,m_2,m_3,m_4,m_5,m_6]]
。由此,我可以很好地提取系数mi
。
现在,我正在尝试对此数据进行二次回归。我希望这能给我一个y = b + m_{11}*x_1 + m_{12}*x_1^2 + m_{21}*x_2 + m_{22}*x_2^2 + ... + m_{62}*x_6^2
形式的模型。因此,我希望我应该得到12个系数m_11,m_12,m_21,m_22,m_31,m_32,m_41,m_42,m_51,m_52,m_61,m_62
。相反,当我按以下代码所示打印qm.coef_
时,得到的是长度为28的numpy数组:
>>> print(qm.coef_)
[ 5.23243620e-08 -4.52818442e+01 -1.69803868e-02 1.23876223e+00
-1.31251424e+01 6.34950041e+01 -5.65064601e-02 -3.04164916e+00
1.22800976e-03 -1.81908736e-02 -1.38319879e+00 -1.88468027e+00
8.98960781e-03 -5.10163574e-07 5.60756672e-04 -8.52068126e-04
-5.09033748e-03 2.67482109e-06 1.10815787e-01 -7.45059709e-01
-1.05108447e+00 6.37628573e-05 -9.12589844e-01 -1.22173903e+00
-5.47228030e-04 6.34950042e+01 -5.39225901e-03 2.21487661e-06]
我的问题是,为什么我要28?我要寻找的12个在哪里,其他16个系数又是什么?
这是我的代码:
poly = PolynomialFeatures(degree=2)
X_poly = poly.fit_transform(x_train)
poly.fit(X_poly,y_train)
qm = LinearRegression()
qm.fit(X_poly,y_train)
print(qm.coef_)
A similar question,尚无答案。 Another similar question,未正确回答。