我必须将包含有关基于place_id的地方的功能的不同csv文件合并为一个,以便我可以创建模型来预测特定地方的等级。
我已经尝试过使用pandas.concat并通过linux终端合并文件,但是随着place_id不断重复,我只是获得所有其他功能的空值
#importing libraries
import pandas as pd
import numpy as np
import glob
#creating a single dataframe
fileList = glob.glob('chef*.csv')
fileList.append('rating_final.csv')
dfList = []
for file in fileList:
print(file)
df = pd.read_csv(file)
dfList.append(df)
concatDf = pd.concat(dfList,axis=0)
我希望根据单个place_id获得具有不同功能的csv文件,但我得到的是csv文件,其中place_id仅重复具有单个功能。