-
PySaprk:处理数据中的高基数
我正在努力确定来自健康保险领域的重复索赔。我的数据高度不平衡-索赔总数中只有2%是<em> 1亿</em>条 -
多类别分类问题中的失衡-四个目标级别
我的数据不平衡,如下所示,每当我尝试使用ADASYN时,它都会显示错误,是否需要为同一参数提供任何 -
Keras中的自定义损耗函数(焦距损耗)输入大小错误
我正在使用中性网络进行多类别分类。有3种不平衡类,因此我想使用散焦来处理不平衡。因此,我使用 -
R
我有一个数据集,可以对胜诉案件(14399)和败诉案件(8677)进行分类。数据集具有912个预测变量。 我 -
不平衡数据的理想平衡比
我有一个数据集,其中我的目标变量的关注类别为1,约占整个数据的85%,其余15%为0类。我们可以说 -
如何处理X射线图像分类问题中CheXpert数据的不平衡数据集
我正在研究使用CNN和DNN的图像分类问题,具体而言。但是,手头的数据高度不平衡,因此产生了高度偏 -
在scikit-learn中使用OneVsRest分类时,每个分类器的一组负数据点是什么?
我正在尝试使用<code>sklearn.linear_model.LogisticRegression(multiclass='ovr')</code>来训练OneVsAll多类逻辑回归模 -
调整后的预测概率
我有一个不平衡的数据集,我使用了smote对少数派进行了过度采样而对多数派进行了欠采样。 现在,我 -
为什么天真svm中的roc-auc分数大于svm + oversample?
我在不平衡数据集中进行情感分析。我遇到的问题是朴素的svm分类器提供的roc-auc得分比svm +采样更好。 -
如何确定不平衡数据集的class_weights
我正在处理不平衡的数据集。我正在尝试借助<code>class_weights</code>建立模型。因此,我可以在什么基础上 -
可以在整体投票分类器中将投票分类器用作基础分类器吗?
我设计了类似于袋装分类器的模型。但是在每个级别中,不是训练单个分类器,而是训练投票分类器作 -
为什么在使用ADASYN和10倍CV进行不平衡分类后AUC结果不好?
我需要对不平衡样本进行分类(class_1:class_0 = 1:9),每个样本具有6个特征。我使用SVM和k倍CV(k = 10) -
我可以使用重采样方法来增加不平衡数据大小以进行预测模型训练吗?
我正在为FIFA-PLAYER工资预测工作。我对数据大小处理不平衡感到好奇。 <a href="https://i.stack.imgur.com -
如何查找或计算非线性数据的重叠和非重叠区域?
我创建了一个综合数据框,如下所示: <pre><code>X, Y = make_classification(n_features=2,n_samples=100, n_redundant=0, -
COCOA多标签不平衡分类-二进制和多类不平衡学习器
我想问一下<a href="https://pdfs.semanticscholar.org/cdb1/6b0dedde51cb722027c6c2718f776c52039d.pdf" rel="nofollow noreferrer">paper</ -
隔离林不适用于不平衡的数据
我的数据带有以下标签: <blockquote> <ul> <li>观测值:144496 /观察标签:162 </li> <li>培训观察: -
如何提高不平衡数据的查全率?
我用3种不同的随机森林方法对不平衡数据进行了建模。然后,我在验证数据上测试了该模型,您可以在 -
是否有任何python代码可用于实施“大致平衡装袋”算法?
我正在寻找python中大致平衡的装袋算法实现的示例。 -
不平衡数据集的二进制分类问题
我是机器学习的新手,需要帮助。我有两个类别(0,1)的数据集,其中0是可获利的,1是不可获利的。火 -
如何在Keras中使用CNN处理用于多标签分类的不平衡数据?
我的数据集形状为<code>(91149, 12)</code> 我使用CNN在文本分类任务中训练分类器 我发现训练准 -
为什么将机器学习模型的预测概率的平均值用作“预测目标率”?
这可能是一个愚蠢的问题。 假设我们针对二元分类问题训练了一个分类器(逻辑回归,RandomForest -
预先处理在GridSearchCV管道中使用SMOTEENN
我正在处理高度不平衡的数据集的分类问题。我正在尝试在网格搜索管道中使用<code>.parent { display: flex; -
重新采样(增强)连续数据的数据集以解决回归问题
对于回归问题,我有一个训练数据集: -3个具有高斯分布的变量 -20个变量具有均匀分布。 我 -
不平衡数据的特征工程
我正在训练有关分类问题的机器学习模型。我的数据集是具有<em> 37 </em>类别的<em> 10000 </em>个观测值。但 -
什么是对高度不平衡的数据集进行采样的正确方法?
我有一个数据集,具有23个相关性非常低的特征。这两个类别之间的差异很小。 类非常不平衡,就 -
CNN通过训练不平衡数据集使用EarlyStopping-设置class_weights与f1-score
我想使用EarlyStopping来训练具有非常不平衡的数据集的CNN。我已经读过关于设置类权重的信息,如下所示 -
深度学习:多类分类,在训练数据集和测试数据集之间具有相同数量的标签
我正在编写用于进行多类分类的代码。我有具有7列(6个要素和1个标签)的自定义数据集,训练数据集 -
无法使用SMOTE,SMOTE-NC容纳文本数据,但能够在RandomOverSampling上运行代码
我们编写了以下代码,需要在其中将给定文档分类为所属行业。但是实际数据高度不平衡,因此我们考 -
多标签输出中的数据不平衡问题
我有一个图像数据集,其中两个图像(左眼和右眼)图像具有相同的多标签。 为了处理图像,我 -
不平衡的数据集-如何通过网格搜索优化超参数?
我想通过使用网格搜索不平衡数据集来优化SVC的超参数C和Gamma。到目前为止,我已经使用class_weights ='bala