从数据框列中提取一些特征用于KNN算法

我的问题是关于从数据框列中选择和提取某些功能。这会影响ML算法的有效性吗? 例如,我正在对“芝加哥犯罪数据集”进行分析。它具有“发生日期”列,并且具有以下形式的数据:“ 2018-11-23 05:10:00”。我想做的是,我想为此添加一些额外的列,用于“年”,“月”,“工作日”,“小时”。

这会影响KNN分类器算法的效率。

如果要检查我正在谈论的数据集,这是数据集的链接。

https://data.cityofchicago.org/Public-Safety/Crimes-2001-to-present/ijzp-q8t2

cugdonjuan 回答:从数据框列中提取一些特征用于KNN算法

添加新功能始终有益于模型学习。始终建议为日期列添加单独的新日期功能。

day month day_of_week year is_it_weekend hour minute AM_PM season >

本文链接:https://www.f2er.com/2999628.html

大家都在问