С пускането на pandas 0.24.0 вече има официален начин
за да постигнете това чрез предаване на персонализиран метод за вмъкване към to_sql
функция.
Успях да постигна поведението на REPLACE INTO
чрез предаване на това извикване на to_sql
:
def mysql_replace_into(table, conn, keys, data_iter):
from sqlalchemy.dialects.mysql import insert
from sqlalchemy.ext.compiler import compiles
from sqlalchemy.sql.expression import Insert
@compiles(Insert)
def replace_string(insert, compiler, **kw):
s = compiler.visit_insert(insert, **kw)
s = s.replace("INSERT INTO", "REPLACE INTO")
return s
data = [dict(zip(keys, row)) for row in data_iter]
conn.execute(table.table.insert(replace_string=""), data)
Бихте го предали така:
df.to_sql(db, if_exists='append', method=mysql_replace_into)
Като алтернатива, ако искате поведението на INSERT ... ON DUPLICATE KEY UPDATE ...
вместо това можете да използвате това:
def mysql_replace_into(table, conn, keys, data_iter):
from sqlalchemy.dialects.mysql import insert
data = [dict(zip(keys, row)) for row in data_iter]
stmt = insert(table.table).values(data)
update_stmt = stmt.on_duplicate_key_update(**dict(zip(stmt.inserted.keys(),
stmt.inserted.values())))
conn.execute(update_stmt)
Кредити на https://stackoverflow.com/a/11762400/1919794 за метода за компилиране.