DataFrame实例是混合的字母数字字符串类型。但是,DataFrame中的所有实例仅包含三个字符串中的一个公共子字符串,这三个字符串分别是正常,背景,僵尸网络。我想将数据框的所有实例替换为这3个实例,以使数据框类型成为分类。
OriginalDF ConvertedDF
To-background flow udp flows background
To-botnet flow tcp syn packet botnet
To-normal flow tcp syn packet normal
To-normal flow tcp flows normal
To-botnet flow ack connection established botnet
To- normal flow tcp flows normal
To-background flow tcp flows background
我尝试使用迭代方法,效果很好。
for i in range(cat_data.shape[0]):
if( "Background" in cat_data.Label[i]):
cat_data.Label[i] = "Background"
elif( "Normal" in cat_data.Label[i]):
cat_data.Label[i] = "Normal"
else:
cat_data.Label[i] = "Botnet"
他们使用正则表达式执行这种任务的任何标准或定制方式是否仅使用一个或两个语句,而不是传统的迭代方式来完成这项工作?