我有以下两个熊猫DataFrame:
第一个:
df1 = pd.DataFrame({'Name':['John','John','Paul','Jimmy'],'Book':['B1','B2','B1','B3','B4','B3']})
╔═══════╦══════╗
║ Name ║ Book ║
╠═══════╬══════╣
║ John ║ B1 ║
║ John ║ B2 ║
║ John ║ B1 ║
║ Paul ║ B3 ║
║ Paul ║ B4 ║
║ Jimmy ║ B3 ║
╚═══════╩══════╝
第二个:
df2 = pd.DataFrame({'Name':['John','Age':[25,18,28]})
╔═══════╦═════╗
║ Name ║ Age ║
╠═══════╬═════╣
║ John ║ 25 ║
║ Paul ║ 18 ║
║ Jimmy ║ 28 ║
╚═══════╩═════╝
我希望结果是:
╔═══════╦══════╦═════╗
║ Name ║ Book ║ Age ║
╠═══════╬══════╬═════╣
║ John ║ B1 ║ 25 ║
║ John ║ B2 ║ 25 ║
║ John ║ B1 ║ 25 ║
║ Paul ║ B3 ║ 18 ║
║ Paul ║ B4 ║ 18 ║
║ Jimmy ║ B3 ║ 28 ║
╚═══════╩══════╩═════╝
也就是说,使用“名称”列作为键,将“年龄”列添加到第一数据框,并保留重复的名称。