feature-extraction

使用整个数据框列的Pandas Dataframe.expanding.apply

我想使用熊猫数据框扩展窗口的多列提取一些特征。 <pre><code>>>> df = pd.DataFrame({"amount":[1

前端之家
2022-08-09 • 问答
如何使用递归特征消除？

我是ML新手，一直在尝试使用RFE方法进行功能选择。我的数据集有5K条记录及其二进制分类问题。这是基

前端之家
2022-08-09 • 问答
sklearn中的sklearn.feature_extraction.FeatureHasher 0.22

我刚刚更新为sklearn 0.22。我的代码曾经在以前的版本中工作，但现在却出现错误： <pre><code>from sklearn

前端之家
2022-08-09 • 问答
如何从此对象列表中提取嵌套字典及其数据？

如何从此对象列表中提取嵌套字典及其数据？我给了一个数据框，其中有多个列，这些列具有作

前端之家
2022-08-08 • 问答
使用cv2.COLOR_BGR2GRAY或color.rgb2gray作为来自skimage的生猪描述符？

我想训练具有SVM提取的生猪特征的SVM skimage的猪描述符。图像具有3个通道（RGB图像），我想在提取猪的

前端之家
2022-08-08 • 问答
如何将信息提取到csv（我需要一页用于页码，一列用于引文信息）

我正在尝试使用pdfminer和其他软件包从pdf文件中提取（文本）。提取已完成，将我的数据导出为csv时出现

前端之家
2022-08-07 • 问答
在坐标系中用于对点进行聚类的功能是什么？

我有一个由6个标签组成的数据集。您可以将它们视为坐标系中的点。问题在于2个组可能位于不同的位置

前端之家
2022-08-07 • 问答
从SelectPercentile中提取特征详细信息：列名称和相应分数

我正在尝试使用<code>Pipeline</code>和<code>SelectPercentile</code>和<code>RandomForestClassifier</code>将特征分数与列名

前端之家
2022-08-07 • 问答
如何使用排列特征重要性获取值

我有一个5K（和60个特征）记录的数据集，主要用于二进制分类。请注意，此<a href="https://stackoverfl

前端之家
2022-08-07 • 问答
如何在jupyter中解释和查看完整的置换特征图？

我正在尝试通过<code>Permutation Feature Importance</code>图生成特征重要性图。我试图确定通过不同方法返回的

前端之家
2022-08-07 • 问答
有关功能选择的查询

为了选择其他功能，我选择了 1。所有单词（从训练集中收集的所有不同单词）在评论中出现的次

前端之家
2022-08-06 • 问答
在连接之前或之后使用StandardScaler缩放多个功能？

我有一个图像数据集（像素值介于0到255之间），我想从中提取不同的特征，例如HOG功能，Gabor滤镜功能

前端之家
2022-08-06 • 问答
从布尔特征数据集中选择最合适的特征

我有大约50万个布尔特征（1：存在或0：不存在）的数据集，其中70％的特征仅被2％的样本调用，意味着

前端之家
2022-08-05 • 问答
ML中的多项式特征

我有10个功能，所有功能都是数字。多项式特征只能用于连续变量而不能用于离散变量吗？在创

前端之家
2022-08-04 • 问答
具有2个缩放比例和8个方向且带有skimage的Gabor滤波器

我尝试了解Gabor过滤器，但是在使用以下方法实现此过滤器时遇到问题 skimage。<br/> 我的问题可能很容易

前端之家
2022-08-04 • 问答
PCA分析引发了内存分配问题。如何解决此问题而不降低图像分辨率或图像数量

使用PCA（原理成分分析）从一组4K图像中提取特征，从而给我带来存储错误 <em>文件“ /home/paul90/.l

前端之家
2022-08-04 • 问答
有没有一种简单的方法可以在标签不是最后一列的情况下分离因变量和自变量？

我的数据有很多功能，标签不是最后一列。我不知道标签列的确切位置。我不想收集和复制功能名称并

前端之家
2022-08-04 • 问答
Tensorflow内存呈指数增长

此代码段中我面临内存不足的问题。 <pre><code>import tensorflow as tf from architecture import inception_resnet_v1 as

前端之家
2022-08-04 • 问答
除了在这里使用apply函数之外，还有什么更好的方法/函数可以用来获取新列？

我正在尝试根据RFM得分将客户分类，以下是我在Python中使用的功能。数据集包含950K行和4列。我是python的

前端之家
2022-08-03 • 问答
自动编码器的编码器输出中的大多数条目为零，用于从高分辨率图像中提取特征

我正在使用一个简单的自动编码器从高分辨率图像（2K）中提取有意义的特征。我简单的AutoEncoder

前端之家
2022-08-03 • 问答
从字符串中提取信息并将其转换为列，以供在python pandas中进一步使用

这是我正在处理的数据集 <pre><code>Sr. No. Product Rate Offered 0 1 Beige Glossy 100 1

前端之家
2022-08-02 • 问答
如何通过使用skimage而不是OpenCV获得色调值的颜色直方图？

我想获取RGB图像的颜色直方图。它应该是HSV色彩空间中的色相值的全局直方图，从而每幅图像具有256个

前端之家
2022-08-02 • 问答
R中的随机森林-特征提取方法？

我正在一个大学项目中，我需要在R中建立随机森林模型，以根据患者的EEG数据预测患者是否有抑郁倾向

前端之家
2022-08-02 • 问答
我正在尝试特征提取，并希望垂直堆叠数组，但这是我得到的错误。 ValueError：使用序列设置数组元素

<pre><code>print('[INFO] abnormal_activity feature extraction...') for img in abnormal_activity: abnormal_features.append(fHelp.

前端之家
2022-08-02 • 问答
如何从FFT提取特征？

我正在从以200 Hz采样的X，Y和Z加速度传感器收集数据。 3轴组合成一个称为“ XYZ_Acc”的信号。我遵循了

前端之家
2022-08-01 • 问答
预训练的VGG16的GTSRB功能-不良结果

我想使用预先训练的VGG16网络进行特征提取 GTSRB数据集。所提取的特征用作具有512个节点的密集层的输

前端之家
2022-08-01 • 问答
按奇数/偶数行将datafram从一列拆分为两列，

嗨，我有一个带有一个冒号的数据框 <pre><code>| id|text | |---|---------

前端之家
2022-08-01 • 问答
从SuperPixels提取特征的最佳方法，例如gabor和HOG特征

我已经使用Slic聚类算法创建生物医学图像（生物医学成像专家的整个幻灯片图像）的超像素。我想为超

前端之家
2022-08-01 • 问答
VectorAssembler的格式错误，给功能添加了不必要的值

我已经使用<code>VectorAssembler</code>多次，效果很好。但是今天，我将不需要的数据添加到功能中，如下图

前端之家
2022-07-31 • 问答
无法从tsfresh包中使用“ extract_features”方法从时间序列数据中提取要素

我正在Anaconda3 2019.03（Python 3.7.3 64位）中的Spyder（3.3.3）中运行代码。并使用tsfresh 0.11.1 我正在运

前端之家
2022-07-31 • 问答