-
如何为test_train_split选择数据框中的数据列和目标列?
我正在尝试使用从csv读取到pandas数据帧中的数据设置<code>test_train_split</code>。我正在阅读的书说我应该分 -
Python NLP-Sklearn-负号和正号标签的文本分类器,字母组合和双字相同
我正在尝试创建文本分类器,以确定摘要是否表示对护理研究项目的访问。我正在从具有两个字段的数 -
在机器学习中使用三种不同的标签
我真的是机器学习的新生。我正在查看将电子邮件中的垃圾邮件或火腿值分开的代码。为另一个数据集 -
Sklearn Labelencoder在对新数据帧进行编码时会保留编码值
我正在编写一个脚本,该脚本使用“局部异常值”算法进行“新颖性检测”。 在这种情况下,我们需要 -
SKLearn是否有最低硬件要求?
就我的代码而言,这并不是一个编程问题,而是一个关于我的代码运行速度的问题。 我正在尝试 -
如何设置Pandas Datafrane字幕的字体?
我试图在Jupyter笔记本中并排显示两个表。 我有一些执行此操作的代码: <pre><code>header = ["Metric" -
根据规则“安全”,无法将数组数据从dtype('float64')转换为dtype('<U32')
我正在使用sklearn MLPClassifier类,并且遇到错误:无法将数组数据从dtype('float64')转换为dtype(' -
提高sklearn中的随机森林回归器的性能
有一个优化问题,我必须调用随机森林回归器的预测函数数千次。 <pre><code>from sklearn.ensemble import Ran -
带有Sklearn的MNIST数据集
我正在MNIST数据集上训练线性模型,但我只想训练一个数字4。如何选择X_test,X_train,y_test和y_train? -
如何在Python的多元线性回归模型中增加收入和就业之间的互动条件?
我已经成功地用Python建立了带有某些术语的回归模型。如何在此模型的<strong>收入</strong>和<strong>就业</st -
如何在Python的回归模型上执行Box Cox转换?
如何在Python的回归模型上执行Box Cox转换? 我正在使用这些进口商品 <pre><code>from sklearn.linear_mod -
训练SVM模型后如何加载未标记的数据进行情感分类?
我正在尝试进行情感分类,并且使用了sklearn SVM模型。我使用标记的数据训练模型,并获得89%的准确性 -
GridSearchCV:ValueError-self._run_search(evaluate_candidates)
我正在尝试在我的数据集中使用<strong> Scikit Learn </strong>的不同回归变量,并且使用<strong> GridSearchCV </stro -
从多个数据框中统计比较特定列的值
我有一列,在所有多个数据框中都名为“ x”。其中一个数据帧包含实际测得的辐照度值,其他数据帧包 -
如何找到DBSCAN的最佳参数?
是否有任何工具可以为DBSCAN算法计算分钟数和eps的最优值? 当前,我使用sklearn库应用DBSCAN算法 -
是否可以通过stratifiedKFold重新获得列表?
我想做这样的事情: <pre><code>Skf = sklearn.model_selection.StratifiedKFold(n_splits = 5, shuffle = True) ALPHA,BETA = Sk -
带有最小组的Python DummyRegressor
尝试使用sklearn.dummy DummyRegressor为我的模型创建基线,该基线是具有编码分类变量的回归模型,以预测连 -
终端Anaconda不同步到Jupyter
我到处都看过,但是找不到我的处境。 我删除了以前的安装,并进行了全新的Anaconda3安装。 <br/> 我认为 -
如何从列表中提取地图项?
如何通过python这样从数据集中提取特征: <a href="https://i.stack.imgur.com/M0X3O.png" rel="nofollow noreferrer">< -
如何使用Euros + pandas Python中的样式格式过滤数据
我有一个数据库,使用样式格式(欧元)时遇到一些问题 <pre><code>df.head(3).style.format({'Budget': &# -
使用python onnxruntime进行预测时出错
我使用<code>sklearn</code>库创建了一个非常基本的决策树。该树是根据以下4个特征进行训练的: <pre><co -
使用sklearn columntransfromer时解压缩错误
我正在尝试对一个数据帧进行热编码以进行一些测试。 我尝试使用<code>OneHotEncoder</code>中的常规<co -
Python Logistic回归错误:“ TypeError:issubclass()arg 2必须是一个类或类的元组”
我正在创建一个具有4种可能结果的多类分类模型。它昨天有效,但是今天,我收到以下错误。我对Python -
Jupyter Notebook PySpark OSError [WinError 123]文件名,目录名称或卷标签语法不正确:
<b>系统配置:</b> 作业系统:Windows 10 的Python版本:3.7 Spark版本:2.4.4 SPARK_HOME:C:\ spark \ spark-2.4.4-bin-ha -
基于关键字的数据帧列上的TF-IDF得分
我正在做一个练习,其中我必须根据数据集预测某个属性的值。 数据框包含名为<code>description</code -
有没有办法应用在句子级数据上训练过的sklearn模型对更长的文档进行预测?
我试图弄清楚是否可以训练带注释的数据进行情感分析,其中每个数据点都是一个句子,然后在更大的 -
如何使用DictVectorizer进行转换和反演后检索原始数据帧
<strong>问题</strong>:我有一个类别数据框,其中有10列以上,下面只是一个示例数据。我想转换并检索回 -
模块“ pandas”的任何解决方案都没有属性“ rolling_mean”吗?
<pre><code>df_ordered['date_after_april1_2015'] = df_ordered.DateTime > datetime(year=2012, month=4, day=1) data_mean_5day = pd.r -
如何根据交叉验证得分做出预测?
我正在构建预测模型。在获得交叉验证分数之前,我一直努力达到目标。现在我不知道如何继续。我应 -
model_selection.cross_val_predict()函数如何工作?它是否使用来自model_selection.cross_val_score()输出的任何参数值?
<pre><code>scoring = 'accuracy' kfold = model_selection.KFold(n_splits=10, random_state=seed) cv_results = model_selection.cross_val