使用to_sql将数据附加到pandas中已经存在的表中
问题内容:
我有以下数据框
ipdb> csv_data
country sale date trans_factor
0 India 403171 12/01/2012 1
1 Bhutan 394096 12/01/2012 2
2 Nepal super 12/01/2012 3
3 madhya 355883 12/01/2012 4
4 sudan man 12/01/2012 5
到目前为止,我正在使用下面的代码在表中插入数据,例如如果表已经存在,则将其删除并创建新表
csv_file_path = data_mapping_record.csv_file_path
original_csv_header = pandas.read_csv(csv_file_path).columns.tolist()
csv_data = pandas.read_csv(csv_file_path, skiprows=[0], names=original_csv_header, infer_datetime_format=True)
table_name = data_mapping_record.csv_file_path.split('/')[-1].split('.')[0]
engine = create_engine(
'postgresql://username:password@localhost:5432/pandas_data')
# Delete table if already exits
engine.execute("""DROP TABLE IF EXISTS "%s" """ % (table_name))
# Write the pandas dataframe to database using sqlalchemy and pands.to_sql
csv_data_frame.to_sql(table_name, engine, chunksize=1000)
但是我需要的是在不删除表的情况下,如果表已经存在,只需将数据追加到已经存在的表中,pandasto_sql
方法中有什么办法吗?
问题答案:
您可以简单地使用IIUCif_exists='append'
参数:
csv_data_frame.to_sql(table_name, engine, if_exists='append', chunksize=1000)
来自docs:
if_exists :{‘失败’,’替换’,’附加’},默认’失败’
失败:如果表存在,则不执行任何操作。
replace:如果存在表,则将其删除,重新创建并插入数据。
append:如果存在表,则插入数据。如果不存在则创建。