我的DataFrame存在3列[id,title,description]。 我需要清除一栏(说明)的重复项,所以我使用
x = df['description'].unique()
x = pd.DataFrame(x)
它可以根据需要清除重复项,但是由于某种原因,我无法找出如何保留所有其他列的方法。我知道删除带有不同标题等的行似乎没有意义,由于我的项目中的其他原因,我至少需要一个参考。谢谢!
init:
id title description
1 a aaaaaa
2 b bbbbbb
3 c aaaaaa
目标:
id title description
1 a aaaaaa
2 b bbbbbb
当前:
description
aaaaaa
bbbbbb