-
Keras:多类不平衡数据分类过拟合
我有一个约1000行的小型数据集,其中包含两个分类列<code>[Message]</code>,<code>[Intent]</code>。我想创建一个 -
R
我有一个数据集,可以对胜诉案件(14399)和败诉案件(8677)进行分类。数据集具有912个预测变量。 我 -
使用SMOTE
我有一条推文的不平衡数据集,标为-1、0,+ 1。 我想通过上采样来平衡数字。我收到以下错误: <pre -
SMOTE函数在make_pipeline中不起作用
我想同时应用交叉验证和过度采样。 我从此代码中收到以下错误: <pre><code>from sklearn.pipeline import Pip -
PySaprk管道中的交叉验证过采样
我正在研究PySpark二进制分类管道,我想在其中执行过验证阶段的CrossValidation(我的数据集不平衡)。问 -
为什么在使用ADASYN和10倍CV进行不平衡分类后AUC结果不好?
我需要对不平衡样本进行分类(class_1:class_0 = 1:9),每个样本具有6个特征。我使用SVM和k倍CV(k = 10) -
Python过采样性能提高
我目前正在解决不平衡数据集的分类问题(约占少数群体的17%)。 我使用来自sklearn的分层k倍拆分(分 -
AttributeError:使用SMOTE时,“ DataFrame”对象没有属性“名称”
我正在使用imblearn过采样SMOTE技术来平衡我的不平衡数据集。 这是我的示例代码 <pre><code>import p -
什么是对高度不平衡的数据集进行采样的正确方法?
我有一个数据集,具有23个相关性非常低的特征。这两个类别之间的差异很小。 类非常不平衡,就 -
python中的图像数据欠采样
欠采样的主要思想是随机删除具有足够观测值的类别,以便两个类别的比较比在我们的数据中很重要。 -
使用SMOTE进行过采样
我的数据集不平衡,因此我尝试在管道中包含SMOTE。但是与基线模型相比,新模型存在过度拟合的问题, -
我正在尝试使用ROSE帮助采样不平衡现象。我的ovun.sample代码正在创建空值,该如何解决?
我正在尝试使用ROSE来帮助解决不平衡的数据集。我在那里大约有90%,但是我的ovun.sample代码遇到了麻烦 -
SMOTE过采样会创建新的数据点
我正在尝试解决不平衡的分类问题,所有输入功能都是分类的。 这是每个功能的价值计数: <pre><code -
过采样:SMOTE参数“比率”
jupyter笔记本让我出错: <blockquote> <strong> init </strong>()获得了意外的关键字参数'ratio' </bloc -
Python-是否有一种我可以用于过采样时间敏感数据的技术
我正在尝试进行预测性维护,失败率为5%。这是对时间敏感的信息,并且随着时间的流逝会发生故障。 -
我可以单独为目标课程申请PCA吗?
Q1)我在一个高度不平衡的数据集中工作,该数据集具有300列* 400000行,在将数据分成训练和测试集之前 -
如何在Imblearn中获取已创建样本的索引
我正在对包含〜55800个样本的数据集使用不同的<strong> imblearn </strong>过采样方法。大约200个是第1类,其 -
使用sklearn.train_test_split处理不平衡数据
我的数据集非常不平衡。我使用sklearn.train_test_split函数提取火车数据集。现在我想对火车数据集进行超 -
使用过采样对自动编码器进行降噪?
降噪自动编码器正在使用添加了噪声的训练样本来预测(原始)训练样本本身。目标是在应用于真实样 -
为什么以及如何进行OVERSAMPLING plot_learning_curves
使用过采样时,我在理解plot_learning_curves图表时遇到问题。我比较了我上传到plot_learning_curves的6个分类模 -
SMOTEENN具有多类分类
我正在尝试将数据欠采样和过采样与多类分类合并起来。我有18个不同的班级。 我尝试使用以下代 -
在python中对文本分类进行过采样?
我有一个要分类的文本数据框。但是我需要先进行过采样。请在下面找到示例数据: <pre><code>df=[[' -
TypeError:__init __()使用SMOTE时获得了意外的关键字参数'ratio'
由于数据集不平衡,我正在使用SMOTE进行过采样。我收到了意外的参数错误。但是在文档中,<code>ratio</co -
Python-如何区分SMOTE重采样和原始数据
我过度使用SMOTE对数据采样,如下所示: <pre><code>>>> from imblearn.over_sampling import SMOTE >>> -
大数据帧上的2D高斯过采样
我目前具有以下格式的数据框: <pre><code>step tag_id x_pos y_pos 1 1 5 3 1 2 3 4 2 -
pyspark按每个目标变量进行过采样
我想知道是否有任何方法可以使用pyspark对数据进行过采样。 我有目标变量为10类的数据集。截至目 -
仅具有名义特征的过采样,在这种情况下,哪种过采样或欠采样技术可能有效?
我有所有特征均标称的数据。我使用了SMOTE-NC,然后发现它只能与名义功能和连续功能结合使用!。 < -
使用SMOTE进行过采样会从y_train中删除标签类别
我正在使用LSTM进行情感分析,方法是使用具有86%正类和14%负类样本的不平衡数据集。这是一个非常小 -
复制时间序列样本
我有一个高度不平衡的数据集: <pre><code>from collections import Counter unique1, counts1 = np.unique(labels_ds , retur -
用于情感分析的混合神经网络架构
我是机器学习领域的新手。我正在尝试使用不同的深度学习模型来实现情感分析。我已经实现了LSTM,BiLS