我有一列名称,它们使用不同的语言,并以不同的格式输入。似乎英文和中文名称以“,”作为分隔符。朝鲜语名称带有“。”作为分隔符,而日语名称同时具有“,”和“ /”作为分隔符。希望能够获得New_Name列
Name_old Language New_Name
Phillipe,Mr Johnson English Mr Johnson Phillipe
李,Mr 永 Mandarin Mr 永 李
김두한.Kim Do Han Korean Kim Do Han
Amori,Shinji/ あもりさせる / 由紀 Japanese Shinji Amori
我尝试了以下代码,但仅适用于英文和中文名称。我想我可能必须根据语言列过滤行,然后进行字符串拆分。感谢任何形式的帮助,谢谢。
splitname = df1["Name_old"].str.split(",",n = 1,expand = True)
# create first name column based on values after comma in Name_old column
df1["First_Name"]= splitname[1]
# create first name column based on values before comma in Name_old column
df1["Last_Name"]= splitname[0]
#concatenate the first name and last name
df1['New_Name'] = df1['First_Name'] +' '+ df1['Last_Name']