我想使用 pd.get_dummies()将特定类别变量转换为虚拟变量,以用于测试和训练数据,因此,我使用了for循环,而不是分别对它们进行处理。但是,以下代码不起作用,并且 .head()返回相同的数据集。
combine = [train_data,test_data]
for dataset in combine:
dummy_col = pd.get_dummies(dataset['targeted_sex'])
dataset = pd.concat([dataset,dummy_col],axis = 1)
dataset.drop('targeted_sex',axis = 1,inplace = True)
train_data.head() # does not change
即使我使用了遍历这样的索引的迭代器,也仍然无法使用。
for i in range(len(combine)):
我可以寻求帮助吗?另外,Pandas get_dummies()不提供就地选项。