sklearn-pandas

如何为test_train_split选择数据框中的数据列和目标列？

我正在尝试使用从csv读取到pandas数据帧中的数据设置<code>test_train_split</code>。我正在阅读的书说我应该分

前端之家
2022-08-16 • 问答
Python NLP-Sklearn-负号和正号标签的文本分类器，字母组合和双字相同

我正在尝试创建文本分类器，以确定摘要是否表示对护理研究项目的访问。我正在从具有两个字段的数

前端之家
2022-08-16 • 问答
在机器学习中使用三种不同的标签

我真的是机器学习的新生。我正在查看将电子邮件中的垃圾邮件或火腿值分开的代码。为另一个数据集

前端之家
2022-08-16 • 问答
Sklearn Labelencoder在对新数据帧进行编码时会保留编码值

我正在编写一个脚本，该脚本使用“局部异常值”算法进行“新颖性检测”。在这种情况下，我们需要

前端之家
2022-08-16 • 问答
SKLearn是否有最低硬件要求？

就我的代码而言，这并不是一个编程问题，而是一个关于我的代码运行速度的问题。我正在尝试

前端之家
2022-08-15 • 问答
如何设置Pandas Datafrane字幕的字体？

我试图在Jupyter笔记本中并排显示两个表。我有一些执行此操作的代码： <pre><code>header = ["Metric&#34

前端之家
2022-08-14 • 问答
根据规则“安全”，无法将数组数据从dtype（'float64'）转换为dtype（'<U32'）

我正在使用sklearn MLPClassifier类，并且遇到错误：无法将数组数据从dtype（'float64'）转换为dtype（'

前端之家
2022-08-14 • 问答
提高sklearn中的随机森林回归器的性能

有一个优化问题，我必须调用随机森林回归器的预测函数数千次。 <pre><code>from sklearn.ensemble import Ran

前端之家
2022-08-14 • 问答
带有Sklearn的MNIST数据集

我正在MNIST数据集上训练线性模型，但我只想训练一个数字4。如何选择X_test，X_train，y_test和y_train？

前端之家
2022-08-14 • 问答
如何在Python的多元线性回归模型中增加收入和就业之间的互动条件？

我已经成功地用Python建立了带有某些术语的回归模型。如何在此模型的收入和就业</st

前端之家
2022-08-14 • 问答
如何在Python的回归模型上执行Box Cox转换？

如何在Python的回归模型上执行Box Cox转换？我正在使用这些进口商品 <pre><code>from sklearn.linear_mod

前端之家
2022-08-14 • 问答
训练SVM模型后如何加载未标记的数据进行情感分类？

我正在尝试进行情感分类，并且使用了sklearn SVM模型。我使用标记的数据训练模型，并获得89％的准确性

前端之家
2022-08-14 • 问答
GridSearchCV：ValueError-self._run_search（evaluate_candidates）

我正在尝试在我的数据集中使用 Scikit Learn 的不同回归变量，并且使用 GridSearchCV </stro

前端之家
2022-08-14 • 问答
从多个数据框中统计比较特定列的值

我有一列，在所有多个数据框中都名为“ x”。其中一个数据帧包含实际测得的辐照度值，其他数据帧包

前端之家
2022-08-13 • 问答
如何找到DBSCAN的最佳参数？

是否有任何工具可以为DBSCAN算法计算分钟数和eps的最优值？当前，我使用sklearn库应用DBSCAN算法

前端之家
2022-08-13 • 问答
是否可以通过stratifiedKFold重新获得列表？

我想做这样的事情： <pre><code>Skf = sklearn.model_selection.StratifiedKFold(n_splits = 5, shuffle = True) ALPHA,BETA = Sk

前端之家
2022-08-13 • 问答
带有最小组的Python DummyRegressor

尝试使用sklearn.dummy DummyRegressor为我的模型创建基线，该基线是具有编码分类变量的回归模型，以预测连

前端之家
2022-08-13 • 问答
终端Anaconda不同步到Jupyter

我到处都看过，但是找不到我的处境。我删除了以前的安装，并进行了全新的Anaconda3安装。 我认为

前端之家
2022-08-13 • 问答
如何从列表中提取地图项？

如何通过python这样从数据集中提取特征： <a href="https://i.stack.imgur.com/M0X3O.png" rel="nofollow noreferrer"><

前端之家
2022-08-13 • 问答
如何使用Euros + pandas Python中的样式格式过滤数据

我有一个数据库，使用样式格式（欧元）时遇到一些问题 <pre><code>df.head(3).style.format({'Budget': &#

前端之家
2022-08-13 • 问答
使用python onnxruntime进行预测时出错

我使用<code>sklearn</code>库创建了一个非常基本的决策树。该树是根据以下4个特征进行训练的： <pre><co

前端之家
2022-08-12 • 问答
使用sklearn columntransfromer时解压缩错误

我正在尝试对一个数据帧进行热编码以进行一些测试。我尝试使用<code>OneHotEncoder</code>中的常规<co

前端之家
2022-08-12 • 问答
Python Logistic回归错误：“ TypeError：issubclass（）arg 2必须是一个类或类的元组”

我正在创建一个具有4种可能结果的多类分类模型。它昨天有效，但是今天，我收到以下错误。我对Python

前端之家
2022-08-12 • 问答
Jupyter Notebook PySpark OSError [WinError 123]文件名，目录名称或卷标签语法不正确：

系统配置： 作业系统：Windows 10 的Python版本：3.7 Spark版本：2.4.4 SPARK_HOME：C：\ spark \ spark-2.4.4-bin-ha

前端之家
2022-08-12 • 问答
基于关键字的数据帧列上的TF-IDF得分

我正在做一个练习，其中我必须根据数据集预测某个属性的值。数据框包含名为<code>description</code

前端之家
2022-08-12 • 问答
有没有办法应用在句子级数据上训练过的sklearn模型对更长的文档进行预测？

我试图弄清楚是否可以训练带注释的数据进行情感分析，其中每个数据点都是一个句子，然后在更大的

前端之家
2022-08-12 • 问答
如何使用DictVectorizer进行转换和反演后检索原始数据帧

问题：我有一个类别数据框，其中有10列以上，下面只是一个示例数据。我想转换并检索回

前端之家
2022-08-11 • 问答
模块“ pandas”的任何解决方案都没有属性“ rolling_mean”吗？

<pre><code>df_ordered['date_after_april1_2015'] = df_ordered.DateTime > datetime(year=2012, month=4, day=1) data_mean_5day = pd.r

前端之家
2022-08-11 • 问答
如何根据交叉验证得分做出预测？

我正在构建预测模型。在获得交叉验证分数之前，我一直努力达到目标。现在我不知道如何继续。我应

前端之家
2022-08-11 • 问答
model_selection.cross_val_predict（）函数如何工作？它是否使用来自model_selection.cross_val_score（）输出的任何参数值？

<pre><code>scoring = 'accuracy' kfold = model_selection.KFold(n_splits=10, random_state=seed) cv_results = model_selection.cross_val

前端之家
2022-08-11 • 问答

首页

下一页
末页