我有一个表格的数据框:
- index Name_A Name_B
- 0 Adam Ben
- 1 Chris David
- 2 Adam Chris
- 3 Ben Chris
我想获得Name_A和Name_B的邻接矩阵,即:
- Adam Ben Chris David
- Adam 0 1 1 0
- Ben 0 0 1 0
- Chris 0 0 0 1
- David 0 0 0 0
什么是他们最狡猾/可扩展的解决方法?
编辑:另外,我知道如果行Adam,Ben在数据集中,那么在其他一点,Ben,Adam也将在数据集中.
解决方法
您可以在列和索引值的0700和
reindex
之间使用
crosstab
和
reindex
:
- df = pd.crosstab(df.Name_A,df.Name_B)
- print (df)
- Name_B Ben Chris David
- Name_A
- Adam 1 1 0
- Ben 0 1 0
- Chris 0 0 1
- df = pd.crosstab(df.Name_A,df.Name_B)
- idx = df.columns.union(df.index)
- df = df.reindex(index = idx,columns=idx,fill_value=0)
- print (df)
- Adam Ben Chris David
- Adam 0 1 1 0
- Ben 0 0 1 0
- Chris 0 0 0 1
- David 0 0 0 0