train-test-split

回归：训练测试拆分-举行测试吗？

我将数据分为训练和测试样本（70/30），用于基于回归预测的问题（MLP，LSTM等）。在代码内：

前端之家
2022-08-16 • 问答
训练测试拆分时间序列数据而不混合数据的正确方法

我从每个二元类的36个主题中收集了数据，因此总共有72个主题。例如，一个时间序列的长度为30000。我

前端之家
2022-08-15 • 问答
如何使用哈希码方法将数据集分为训练和测试数据集

我正在遵循<code>Hands on Machine learning with Sci-kit learn and tensorflow 2nd edition</code>的代码。在创建训练和测试

前端之家
2022-08-15 • 问答
小数据集，列车测试拆分或列车Val和测试？

我对论文做了一些预测（库存）。我只使用了固定数量的600个样本（无法更改）。由于数据集很小，我

前端之家
2022-08-15 • 问答
拟合训练和测试集，train_test_split方法

我正在尝试使用train_test_split评估我的模型。我定义了以下函数，根据函数中的输入在表（顶部列）上创

前端之家
2022-08-15 • 问答
如何基于SVM分类器打印分类点

我使用“ svm”分类器将其分类为自行车还是汽车。所以，我的特征是0,1,2列，从属是第三列。我可以清

前端之家
2022-08-14 • 问答
找到样本数量不一致的输入变量：[24，25]

我需要帮助调整输入内容以匹配输出。我相信我的问题出在我的目标变量上。我收到标题中所述的错误

前端之家
2022-08-14 • 问答
sklearn train_test_split死亡并关闭python内核

我正在努力将<em> scikit-learn </em>中的<code>train_test_split</code>函数与3d Numpy数组一起使用。我有一个

前端之家
2022-08-14 • 问答
如何使用Python Numpy中的train_test_split将数据拆分为训练，测试和验证数据集？分割不应随机

我想将数据类别明智地分为训练，测试和验证集。例如：如果我们在数据集中有3个正，负和中性类别。

前端之家
2022-08-13 • 问答
使用Python将时间序列数据拆分为训练集和有效集

我正在一个项目中，如果时间序列（例如D1，D2），我已经合并了2个数据集。 <code>D1</code>的间隔为<code>5-

前端之家
2022-08-13 • 问答
通过任何分类器传递的训练和测试数据的数据类型应该是什么？

我一直在将dtype转换为ndarray和测试集之前将其dtype转换为ndarray，但是是否有关于不同分类器的数据类型

前端之家
2022-08-13 • 问答
在多标签样本上使用train_test_split进行分层抽样会显示“ ValueError：找到的输入变量不一致...”

我正在尝试使用分层采样将我的图像数据集划分为训练集和验证集，但是scykit-learn包中的train_test_split方

前端之家
2022-08-13 • 问答
从数据透视表熊猫中提取较小的表

我想将以下数据透视表拆分为训练和测试集（以评估推荐系统），并正在考虑提取两个具有不重叠索引

前端之家
2022-08-12 • 问答
在dask_ml中进行train_test_split-IndexError：索引超出范围

我有两个要在ANN训练之前进行预处理的文件。每个文件的大小约为3GB，因此我决定使用Dask。输入文件的

前端之家
2022-08-12 • 问答
sklearn train_test_split返回测试/训练中的一些元素

我有一个数据集<code>library(dplyr) library(stringr) df %>% mutate_all(~ replace(as.character(.), str_detect(., &#34

前端之家
2022-08-11 • 问答
如何使用RandomForestRegressor方法用Python中的scikitlearn和pandas预测将来的结果？

您好，我在本教程中遇到了有关如何在某些库中使用python以及如何使用体育参考库来预测将来的NCAAB游戏

前端之家
2022-08-09 • 问答
ImportError：无法导入名称“ LatentDirichletAllocation”

我正在尝试导入以下内容： <pre><code>from sklearn.model_selection import train_test_split </code></pre> 并出现以

前端之家
2022-08-09 • 问答
scikit-learn train_test_split是否保留关系？

我正在尝试了解<a href="https://towardsdatascience.com/another-twitter-sentiment-analysis-with-python-part-4-count-vectorizer-b3f49

前端之家
2022-08-07 • 问答
当我尝试对信用卡默认数据进行训练测试拆分时出现错误消息

我试图对来自<a href="https://archive.ics.uci.edu/ml/datasets/default+of+credit+card+clients#" rel="nofollow noreferrer">https://arc

前端之家
2022-08-04 • 问答
为什么我们在train_test_split的两个数组中都包含目标类？

<pre><code>X_train, test_df, y_train, y_test = train_test_split(result, y_true, stratify = y_true, test_size = 0.2) </code></pre> 在上

前端之家
2022-08-03 • 问答
设置为50至50的Train_test_split设置返回的准确度很高，但分成2个文件时返回的准确度较低

我有1个数据集（称为<strong> train_plus_test.csv </strong>），该数据集包含1275行，具有相应的列和标签，用于

前端之家
2022-07-29 • 问答
使用spaCy命令行培训器管理培训/开发分组

我正在使用<a href="https://spacy.io/api/cli#train" rel="nofollow noreferrer"><code>python -m spacy train</code></a>命令行工具

前端之家
2022-07-24 • 问答
经过培训和测试后，我该如何处理新数据？

我有2个问题。我有一个包含分类特征和数字的数据集。我的目的是预测个人的贷款等级。我对<str

前端之家
2022-07-24 • 问答
Optuna示例返回测试集的评估指标是否有缺陷？

我正在使用Optuna进行某些模型的参数优化。在几乎所有示例中，目标函数都返回有关TEST集合的评

前端之家
2022-07-22 • 问答
在scikit-learn的两列上使用分层训练训练测试数据

我有一个数据集，我希望将其分成训练和测试，以便在测试集中有每个数据源（在“源”列中指定）和

前端之家
2022-07-19 • 问答
sklearn train_test_split在3维数组列表上

我想进行图像分类，我有12000个三维numpy数组的列表作为data_X。这些阵列的形状均为300 x 300 x 3（高度，宽

前端之家
2022-07-16 • 问答
尝试在tfidxvectoizer输出上进行train_test_split时报告错误

我正在尝试向量化包含此数据框的“标题”列的文本。看来成功完成了。我认为提取目标用于我的预测

前端之家
2022-07-15 • 问答
Tensorflow自动分割图像

假设我有这样的目录。 <pre><code>full_dataset |---horse <= 40 images of horse |---donkey <= 50 images of donkey |---c

前端之家
2022-07-15 • 问答
机器学习中的训练/测试数据集

我只是有一个一般性问题：在上一份工作中，我的任务是建立一系列非线性模型，以量化某些因

前端之家
2022-07-14 • 问答
火车测试拆分后，如何只标准化int64列？

我有一个准备好建模的数据框，它包含连续变量和一个热编码变量 <pre><code>[EditorGUILayout.BeginHorizontal]

前端之家
2022-07-13 • 问答

首页

下一页
末页