我的问题是关于从数据框列中选择和提取某些功能。这会影响ML算法的有效性吗? 例如,我正在对“芝加哥犯罪数据集”进行分析。它具有“发生日期”列,并且具有以下形式的数据:“ 2018-11-23 05:10:00”。我想做的是,我想为此添加一些额外的列,用于“年”,“月”,“工作日”,“小时”。
这会影响KNN分类器算法的效率。
如果要检查我正在谈论的数据集,这是数据集的链接。
“ https://data.cityofchicago.org/Public-Safety/Crimes-2001-to-present/ijzp-q8t2”