oversampling

Keras：多类不平衡数据分类过拟合

我有一个约1000行的小型数据集，其中包含两个分类列<code>[Message]</code>，<code>[Intent]</code>。我想创建一个

前端之家
2022-08-16 • 问答
R

我有一个数据集，可以对胜诉案件（14399）和败诉案件（8677）进行分类。数据集具有912个预测变量。我

前端之家
2022-08-15 • 问答
使用SMOTE

我有一条推文的不平衡数据集，标为-1、0，+ 1。我想通过上采样来平衡数字。我收到以下错误： <pre

前端之家
2022-08-15 • 问答
SMOTE函数在make_pipeline中不起作用

我想同时应用交叉验证和过度采样。我从此代码中收到以下错误： <pre><code>from sklearn.pipeline import Pip

前端之家
2022-08-15 • 问答
PySaprk管道中的交叉验证过采样

我正在研究PySpark二进制分类管道，我想在其中执行过验证阶段的CrossValidation（我的数据集不平衡）。问

前端之家
2022-08-14 • 问答
为什么在使用ADASYN和10倍CV进行不平衡分类后AUC结果不好？

我需要对不平衡样本进行分类（class_1：class_0 = 1：9），每个样本具有6个特征。我使用SVM和k倍CV（k = 10）

前端之家
2022-08-11 • 问答
Python过采样性能提高

我目前正在解决不平衡数据集的分类问题（约占少数群体的17％）。我使用来自sklearn的分层k倍拆分（分

前端之家
2022-08-08 • 问答
AttributeError：使用SMOTE时，“ DataFrame”对象没有属性“名称”

我正在使用imblearn过采样SMOTE技术来平衡我的不平衡数据集。这是我的示例代码 <pre><code>import p

前端之家
2022-08-05 • 问答
什么是对高度不平衡的数据集进行采样的正确方法？

我有一个数据集，具有23个相关性非常低的特征。这两个类别之间的差异很小。类非常不平衡，就

前端之家
2022-08-01 • 问答
python中的图像数据欠采样

欠采样的主要思想是随机删除具有足够观测值的类别，以便两个类别的比较比在我们的数据中很重要。

前端之家
2022-07-30 • 问答
使用SMOTE进行过采样

我的数据集不平衡，因此我尝试在管道中包含SMOTE。但是与基线模型相比，新模型存在过度拟合的问题，

前端之家
2022-07-23 • 问答
我正在尝试使用ROSE帮助采样不平衡现象。我的ovun.sample代码正在创建空值，该如何解决？

我正在尝试使用ROSE来帮助解决不平衡的数据集。我在那里大约有90％，但是我的ovun.sample代码遇到了麻烦

前端之家
2022-07-18 • 问答
SMOTE过采样会创建新的数据点

我正在尝试解决不平衡的分类问题，所有输入功能都是分类的。这是每个功能的价值计数： <pre><code

前端之家
2022-07-17 • 问答
过采样：SMOTE参数“比率”

jupyter笔记本让我出错： <blockquote> <strong> init </strong>（）获得了意外的关键字参数'ratio' </bloc

前端之家
2022-07-15 • 问答
Python-是否有一种我可以用于过采样时间敏感数据的技术

我正在尝试进行预测性维护，失败率为5％。这是对时间敏感的信息，并且随着时间的流逝会发生故障。

前端之家
2022-07-14 • 问答
我可以单独为目标课程申请PCA吗？

Q1）我在一个高度不平衡的数据集中工作，该数据集具有300列* 400000行，在将数据分成训练和测试集之前

前端之家
2022-07-11 • 问答
如何在Imblearn中获取已创建样本的索引

我正在对包含〜55800个样本的数据集使用不同的<strong> imblearn </strong>过采样方法。大约200个是第1类，其

前端之家
2022-07-10 • 问答
使用sklearn.train_test_split处理不平衡数据

我的数据集非常不平衡。我使用sklearn.train_test_split函数提取火车数据集。现在我想对火车数据集进行超

前端之家
2022-06-30 • 问答
使用过采样对自动编码器进行降噪？

降噪自动编码器正在使用添加了噪声的训练样本来预测（原始）训练样本本身。目标是在应用于真实样

前端之家
2022-06-29 • 问答
为什么以及如何进行OVERSAMPLING plot_learning_curves

使用过采样时，我在理解plot_learning_curves图表时遇到问题。我比较了我上传到plot_learning_curves的6个分类模

前端之家
2022-06-28 • 问答
SMOTEENN具有多类分类

我正在尝试将数据欠采样和过采样与多类分类合并起来。我有18个不同的班级。我尝试使用以下代

前端之家
2022-06-26 • 问答
在python中对文本分类进行过采样？

我有一个要分类的文本数据框。但是我需要先进行过采样。请在下面找到示例数据： <pre><code>df=[[&#39

前端之家
2022-06-26 • 问答
TypeError：__init __（）使用SMOTE时获得了意外的关键字参数'ratio'

由于数据集不平衡，我正在使用SMOTE进行过采样。我收到了意外的参数错误。但是在文档中，<code>ratio</co

前端之家
2022-06-24 • 问答
Python-如何区分SMOTE重采样和原始数据

我过度使用SMOTE对数据采样，如下所示： <pre><code>>>> from imblearn.over_sampling import SMOTE >>>

前端之家
2022-06-23 • 问答
大数据帧上的2D高斯过采样

我目前具有以下格式的数据框： <pre><code>step tag_id x_pos y_pos 1 1 5 3 1 2 3 4 2

前端之家
2022-06-18 • 问答
pyspark按每个目标变量进行过采样

我想知道是否有任何方法可以使用pyspark对数据进行过采样。我有目标变量为10类的数据集。截至目

前端之家
2022-06-14 • 问答
仅具有名义特征的过采样，在这种情况下，哪种过采样或欠采样技术可能有效？

我有所有特征均标称的数据。我使用了SMOTE-NC，然后发现它只能与名义功能和连续功能结合使用！。 <

前端之家
2022-06-12 • 问答
使用SMOTE进行过采样会从y_train中删除标签类别

我正在使用LSTM进行情感分析，方法是使用具有86％正类和14％负类样本的不平衡数据集。这是一个非常小

前端之家
2022-06-10 • 问答
复制时间序列样本

我有一个高度不平衡的数据集： <pre><code>from collections import Counter unique1, counts1 = np.unique(labels_ds , retur

前端之家
2022-06-08 • 问答
用于情感分析的混合神经网络架构

我是机器学习领域的新手。我正在尝试使用不同的深度学习模型来实现情感分析。我已经实现了LSTM，BiLS

前端之家
2022-06-07 • 问答

首页

下一页
末页