Описание сценария
Предположим, что есть таблица mysql, разрезанная горизонтально, разбросаная между несколькими хостами, каждый из которых содержит n таблиц с осколками. Что делать, если нужно одновременно получать доступ к этим таблицам и быстро получать результаты запросов? Вот решение для реализации этого требования с использованием библиотеки asyncio asyncio и асинхронной библиотеки aiomysql python3.
Демо кода
Логирование импорта Импорт случайным import asyncio Из импорта aiomysql create_pool
# Предположим, что таблица mysql распределена на 8 хостов, каждый из которых содержит 16 подтаблиц TBLES = { "192.168.1.01": "table_000-015", #000-015 означает, что указание под этим IP непрерывно от table_000 до table_015 "192.168.1.02": "table_016-031", "192.168.1.03": "table_032-047", "192.168.1.04": "table_048-063", "192.168.1.05": "table_064-079", "192.168.1.06": "table_080-095", "192.168.1.07": "table_096-0111", "192.168.1.08": "table_112-0127",
} ПОЛЬЗОВАТЕЛЬ = «xxx» PASSWD = «xxxx»
# функция обёртки для обнаружения исключений def query_wrapper(func): Асинхронный DEF обертка (*args, **kwargs): Попробуйте: Await func(*args, **kwargs) за исключением исключения как e: print(e) Обратная обёртка
# Фактическая функция обработки доступа SQL реализует асинхронные неблокирующие запросы через AIOMYSQL @query_wrapper Асинхронная защита query_do_something(IP, ДБ, таблица): async с create_pool(host=ip, db=db, user=USER, password=PASSWD) в пуле: async с pool.get() как конк: async с conn.cursor() как CUR: sql = ("выберите xxx из {}, где xxxx") Await cur.execute(sql.format(table)) res = ожидать cur.fetchall() # тогда сделай что-нибудь...
# Генерируйте очередь доступа к SQL, каждый элемент очереди содержит функции и параметры для доступа к таблице def gen_tasks(): Задачи = [] Для интеллектуальной собственности можно прочитать в TBLES.items(): Cols = re.split('_|-', далее) tblpre = "_".join(cols[:-2]) min_num = int(cols[-2]) max_num = int(cols[-1]) для числа в диапазоне(min_num, max_num+1): tasks.append( (query_do_something, ip, 'your_dbname', '{}_{}'.format(tblpre, num)) )
random.shuffle(задачи) Задачи по возврату
# Запускайте очередь запросов на доступ к SQL пакетами def run_tasks(задачи, batch_len): Попробуйте: Для idx в диапазоне(0, len(задачи), batch_len): batch_tasks = задачи[idx:idx+batch_len] logging.info("текущая партия, start_idx:%s len:%s" % (idx, len(batch_tasks))) для i в диапазоне(0, len(batch_tasks)): l = batch_tasks batch_tasks= asyncio.ensure_future( l[0](*l[1:]) ) loop.run_until_complete(asyncio.gather(*batch_tasks)) за исключением исключения как e: logging.warn(e)
# основной метод, реализующий асинхронный вызов функций через asyncio def main(): петля = asyncio.get_event_loop()
Задачи = gen_tasks() batch_len = len(TBLES.keys()) * 5 # всё зависит от вас run_tasks(задачи, batch_len)
loop.close()
|