-
调查一下李克特项目的分数实际上是否与另一项不同?
我的数据集包含一个李克特项目,其中包含参与者当时的精力充沛程度(0-6)。其中0 =完全没有能量, -
可以将PCA标准化为特定功能吗?
在处理具有数百个维度,一些表型和一些元数据的数据集时,我想“规范化” PCA上特定(多个)功能的 -
解释特征交互与特征相关
我对机器学习范式中提到的术语感到困惑吗?任何人都可以在这里放弃某种回应吗?我将感谢您。 -
如何在R中的大型数据集(15GB)上运行监督的ML模型?
我有一个数据集(15 GB):7200万条记录和26个功能。我想比较7个监督的ML模型(分类问题):SVM,随机森 -
RFECV机器学习功能选择花了太长时间的Python
我对SKLearn还是比较陌生,对功能选择有疑问。 我正在尝试建立一个SVM模型,我的数据具有大约30 -
随机森林特征重要性何时会失效?
我对随机森林特征重要性的假设感到好奇。 在此<a href="https://link.springer.com/article/10.1023%2FA%3A10109334 -
SKLearn是否有最低硬件要求?
就我的代码而言,这并不是一个编程问题,而是一个关于我的代码运行速度的问题。 我正在尝试 -
SciKit-Learn标签编码器导致错误“参数必须是字符串或数字”
我有点困惑-在这里创建ML模型。 我正在尝试从“大”数据框(180列)中获取分类特征并对其进行 -
R如何滞后4000列50次
我有一个包含4000列的数据框,并且每日观察结果按<code>time</code>排序。我想创建新列,使其过去的所有 -
特征选择后的贝叶斯优化(R)
我正在使用随机森林进行预测。我得出的结论是x2,x15和x20是最重要的功能。所以我的模型是这样的:</p -
Python中的VIF分析和解释
我试图在著名的mtcars2数据集上应用VIF。 对于VIF计算,我们关注数据集的特征变量以确定多重共线 -
svm-rfe在不同级别的功能上
让我们假设我具有1000个要素的数据。我想对此数据应用SVM-RFE,每次删除10%的功能。 人们如何才能在消 -
通过交叉验证消除递归特征
我不知道为什么随着功能数量的增加,准确性会降低? 下图是<a href="https://scikit-learn.org/stable/auto_e -
正在获取TypeError:'(slice(None,None,None),array([0,1,2,3,4]))'是无效的键
尝试使用BorutaPy进行特征选择。但收到TypeError:'(slice(None,None,None),array([0,1,2,3,4]))'是 -
我们可以同时执行功能选择和PCA吗?
同时执行功能选择和PCA是否有问题 -
通过包装方法逐步前进选择,顺序特征选择出错
SFS是从mlxtend导入的api,它是SequentialFeatureSelector <pre class="lang-py prettyprint-override"><code>from mlxtend.featur -
删除重要功能后再建立一个模型
我们建立了数据科学模型,并关注功能的重要性。如果我们放弃这些功能并建立一个新模型,那么准确 -
不同的数据类型会影响特征选择算法的规范化
假设我们的数据集具有1000个数据(矩阵行)和700个要素(矩阵列)。我想运行各种类型的特征选择算法 -
如何消除用于特征选择的“几乎线性相关”变量?
我有一个来自产品几何测量的6000个样本和118个特征的数据集,它们偏离了“完美形状”。原则上,弹性 -
从OneHotEncoder获得相应的功能
在使用OneHotEncoder转换要素后,我试图对数据集中的某些要素进行一些数据分析,输出显示要素13和要素21 -
我可以/应该将过去的标签用作ML预测中的特征吗?
问题:<em>将标签的过去用作特征是否正常/通常/专业?</em> 尽管这是一个基本问题,但我找不到任何可 -
如何找到由0或1组成的给定数据集的规则?
我有一个包含300万行和81列的数据集。我有标签(0或1)。专栏描述了过去3个月中27种独特功能的用户数 -
成人和儿童(10-16岁之间)是否有任何共同的声学特征
为了使用来自两个组(成人和儿童)的数据集。两组之间是否有任何共同的声学特征 -
我们如何将时间序列数据转换为监督学习问题?
我正在为机器学习模型准备数据。我想将时间序列数据作为正常的有监督学习预测。假设我有一个车速 -
使用交叉验证来计算特征重要性“一些问题”
我目前正在从事一个项目。我已经选择了我的功能,并想检查它们的重要性。如果有人可以帮助我,我 -
如何计算特征选择的t检验
我的数据集中有50个特征,即x1,x2,x3,... x50。输出变量是Result(连续数据)。我想使用t.test选择最佳 -
R中的mRMR经典
是否有任何方法可以在<strong> mRMR.classic </strong>的评估中包括分类值,以在R中进行功能选择? 每 -
是否可以为CountVectorizer创建等效的“限制”方法,就像Scikit学习中的DictVectorizer可用的方法一样?
对于DictVectorizer,可以通过使用strict()方法来子集对象。这是一个示例,其中我使用布尔数组明确列出 -
如何通过LASSO算法获取所选要素的实际名称
有没有一种方法可以使用套索打印带有名称的实际所选特征? <pre><code>lasso001 = Lasso(alpha=0.01, max_iter=1 -
scikit-learn文档中的max_features注意事项
我真的不理解scikit-learn随机森林文档中此注释的含义: <blockquote> “注意:对分割的搜索直到找