在尝试使用多项NB分类器之前,我尝试使用降低特征的维数。现在的事情是,多项式NB在X_train中不采用负值。我在网上找到的建议之一是使用MinmaxScaler将SVD输出缩放到范围(0,1),但是我不确定这样做是否可行。 (Dealing with negative values in sklearn MultinomialNB)。
如何将TruncatedSVD输出用作多项式NB分类器的输入?谢谢!
编辑:下面的示例代码。
vectorizer = TfidfVectorizer()
X = vectorizer.fit_transform(df[col])
#After applying Truncated SVD
transformer = TruncatedSVD()
X_red = pd.DataFrame(transformer.fit_transform(X))
数据集X_red具有负值,以后我无法在Multimonial NB中使用。