QST: How can I use df.to_sql() with SQLAlchemy AsyncSession/AsyncEgine #51633

lamhktommy · 2023-02-25T15:39:07Z

Research

I have searched the [pandas] tag on StackOverflow for similar questions.
I have asked my usage related question on StackOverflow.

Link to question on StackOverflow

https://stackoverflow.com/questions/75566585/how-can-i-use-df-to-sql-with-sqlalchemy-asyncsession-asyncegine

Question about pandas

df.to_sql("temp_data", engine)

Expecting similar things where engine is AsyncEngine

phi-friday · 2023-03-10T03:59:32Z

pandas support for sqlachemy is implemented based on a fairly old version. Therefore, it is not completely compatible with recently added features. However, you can try the following ways:

use to_sql

from __future__ import annotations

from asyncio import current_task, run
from contextlib import asynccontextmanager
from typing import TYPE_CHECKING

import pandas as pd
from sqlalchemy.ext.asyncio import (
    AsyncSession,
    async_scoped_session,
    create_async_engine,
)
from sqlalchemy.ext.automap import AutomapBase, automap_base
from sqlalchemy.orm import sessionmaker

if TYPE_CHECKING:
    from collections.abc import AsyncGenerator

automap: AutomapBase = automap_base()
engine = create_async_engine(...)
maker = sessionmaker(engine, class_=AsyncSession)
scope = async_scoped_session(maker, current_task)

chunk_size: int = ...
tablename: str = ...
data = pd.DataFrame(...)


@asynccontextmanager
async def get_session() -> AsyncGenerator[AsyncSession, None]:
    async with scope() as session:
        yield session


async def main():
    async with get_session() as session:
        conn = await session.connection()
        await conn.run_sync(
            lambda sync_conn: data.to_sql(
                tablename,
                con=sync_conn,
                ...,
            ),
        )
        await session.commit()


if __name__ == "__main__":
    run(main())

use execute

from __future__ import annotations

from asyncio import current_task, run
from contextlib import asynccontextmanager
from typing import TYPE_CHECKING

import numpy as np
import pandas as pd
from sqlalchemy import insert
from sqlalchemy.ext.asyncio import (
    AsyncSession,
    async_scoped_session,
    create_async_engine,
)
from sqlalchemy.ext.automap import AutomapBase, automap_base
from sqlalchemy.orm import sessionmaker

if TYPE_CHECKING:
    from collections.abc import AsyncGenerator

automap: AutomapBase = automap_base()
engine = create_async_engine(...)
maker = sessionmaker(engine, class_=AsyncSession)
scope = async_scoped_session(maker, current_task)

chunk_size: int = ...
tablename: str = ...
data = pd.DataFrame(...)


@asynccontextmanager
async def get_session() -> AsyncGenerator[AsyncSession, None]:
    async with scope() as session:
        yield session


async def main():
    async with get_session() as session:
        conn = await session.connection()
        await conn.run_sync(lambda sync_conn: automap.prepare(autoload_with=sync_conn))
        mapper = getattr(automap.classes, tablename)
        stmt = insert(mapper)

        for _, group in data.groupby(np.arange(data.shape[0], dtype=int) // chunk_size):
            await session.execute(stmt, group.to_dict("records"))
        await session.commit()


if __name__ == "__main__":
    run(main())

Using to_sql is a familiar method, but sqlalchemy>2 is not available due to a bug #51015.

lamhktommy · 2023-03-31T04:09:29Z

@phi-friday thanks. It works for me

ryanmerolle · 2024-10-16T10:09:36Z

Would this still be the case with the updates to the project dependencies over the past year? Thanks again for all the work here!

lamhktommy added Needs Triage Issue that has not been reviewed by a pandas team member Usage Question labels Feb 25, 2023

lamhktommy closed this as completed Mar 31, 2023

man-shar mentioned this issue Jan 15, 2025

Manas/async pg defog-ai/introspect#340

Merged

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

QST: How can I use df.to_sql() with SQLAlchemy AsyncSession/AsyncEgine #51633

QST: How can I use df.to_sql() with SQLAlchemy AsyncSession/AsyncEgine #51633

lamhktommy commented Feb 25, 2023 •

edited

Loading

phi-friday commented Mar 10, 2023

lamhktommy commented Mar 31, 2023

ryanmerolle commented Oct 16, 2024

QST: How can I use df.to_sql() with SQLAlchemy AsyncSession/AsyncEgine #51633

QST: How can I use df.to_sql() with SQLAlchemy AsyncSession/AsyncEgine #51633

Comments

lamhktommy commented Feb 25, 2023 • edited Loading

Research

Link to question on StackOverflow

Question about pandas

phi-friday commented Mar 10, 2023

lamhktommy commented Mar 31, 2023

ryanmerolle commented Oct 16, 2024

lamhktommy commented Feb 25, 2023 •

edited

Loading