【AI】(14) Краткое введение в векторные базы данных с открытым исходным кодом

Маленькая мразь · Опубликовано 25.03.2025 11:29:25

Требования: В прошлый раз мы организовали выбор вложенных моделей, и при преобразовании модели в векторы нужно было рассмотреть возможность сохранения векторов. Существует множество векторных баз данных, таких как: LanceDB, Astra DB, Pinecone, Chroma, Weaviate, QDrant, Milvus, Zilliz, PGVector, Redis, Elasticsearch, Redis, FAISS, SQL Server 2025 и др.

Что такое векторная база данных?

Векторная база данных — это организованная коллекция векторных вложений, включающая векторные вложения, которые можно создавать, читать, обновлять и удалять в любое время. Векторные вложения представляют блоки данных, такие как текст или изображения, в виде числовых значений. Векторная база данных — это система баз данных, предназначенная для хранения и извлечения векторов с высокой размерностью. Он быстро находит ближайший целевой вектор, вычисляя сходство между векторами (например, косинусное сходство, евклидово расстояние и т.д.). Этот метод часто используется для обработки данных, основанных на вложениях, таких как представления текста, изображений, аудио или видеопризнаков.

Векторная база данных — это собрание данных, хранящихся в математической форме. Векторные базы данных облегчают модели машинного обучения запоминание предыдущих входных данных, позволяя использовать машинное обучение для поддержки таких случаев, как поиск, рекомендации и генерация текста. Данные можно идентифицировать по метрикам сходства, а не по точным совпадениям, что позволяет компьютерным моделям понимать контекст данных.

Когда покупатель приходит в обувной магазин, продавец может порекомендовать обувь, похожую на ту, что нравится покупателю. Аналогично, при покупке в интернет-магазине магазин может рекомендовать похожие товары под заголовками, например, «Покупатель также купил...». Векторные базы данных позволяют моделям машинного обучения выявлять похожие объекты, так же как продавец может найти похожую обувь, а магазин электронной коммерции может рекомендовать связанные товары. (На самом деле, магазины электронной коммерции могут использовать такие модели машинного обучения для выполнения этой задачи).

В заключение, векторные базы данных позволяют компьютерным программам проводить сравнения, выявлять взаимосвязи и понимать контекст. Это позволяет создавать современные программы искусственного интеллекта (ИИ), такие как крупные языковые модели (LLM).

Цветность

Место:Вход по гиперссылке виден.

Chroma — это эффективная база данных с открытым исходным кодом на основе Python для крупномасштабного поиска сходства. Он предназначен для решения проблемы поиска сходства в крупномасштабных наборах данных, особенно при работе с данными с большими размерами. Доступны различные варианты хостинга: бессерверные/встроенные, самостоятельно размещенные (клиент-серверные) и облачно-нативные распределённые SaaS-решения с встроенными и клиент-серверными моделями.
Отлично подходит для прототипирования и производственных сред. Благодаря эфемерному характеру хранения данных Chroma идеально подходит для быстрого прототипирования скриптов. С помощью простой настройки пользователи могут легко создавать коллекции и использовать их повторно, облегчая последующие добавления данных. Кроме того, Chroma может автоматически загружать и сохранять данные. При запуске клиента автоматически загружаются данные пользователя; При закрытии данные сохраняются автоматически, что значительно упрощает процесс управления данными. Эта особенность делает Chroma очень популярной на этапах прототипирования и разработки.
Chroma получила стартовый раунд финансирования в мае 2022 года и второй раунд финансирования на сумму $1,800.

Плюсы: Chroma предлагает клиентам более чем десятка языков программирования, может быстро запускать векторное хранилище и является первой векторной базой данных на рынке, которая по умолчанию предлагает режим вложения. Он относительно удобен для разработчиков и прост в интеграции.
Недостатки: функциональность относительно проста, особенно для приложений, требующих более сложных функций. Поддерживаются только вычислительные процессоры, что может ограничивать прирост производительности в ситуациях, требующих значительных вычислительных ресурсов.

LanceDB

Место:Вход по гиперссылке виден.

LanceDB — это векторная база данных с открытым исходным кодом, предназначенная для мультимодальных данных ИИ для хранения, управления, запросов и извлечения крупномасштабных мультимодальных встраиваемых данных. Её ядро написано на Rust и построено на основе Lance — столбцового формата данных, который оптимизирует высокоскоростной случайный доступ и управление наборами данных ИИ, такими как векторы, документы и изображения. Он подходит для различных приложений ИИ, которым необходимо обрабатывать крупноразмерные векторные данные, такие как распознавание изображений, обработка естественного языка, рекомендательные системы и др. LanceDB предоставляет два режима: встроенные и облачные сервисы.

Преимущества: LanceDB устраняет необходимость управлять серверами, снижая затраты разработчиков на эксплуатацию и машины и повышая эффективность разработки. Он оптимизирован для мультимодальных данных и поддерживает различные типы данных, такие как изображения, текст и аудио, что повышает эффективность базы данных при обработке сложных данных. Он предоставляет удобный API интерфейс и инструменты визуализации, позволяя разработчикам легко интегрировать и использовать базы данных.
Недостатки: Её запустят только в 2023 году, это очень новая база данных, и она недостаточно зрелая с точки зрения развития функций и работы сообщества.

PGVector

Место:Вход по гиперссылке виден.

PGVector — это расширение на базе PostgreSQL, разработанное для обеспечения мощных возможностей векторного хранения и запросов. Он использует язык C для реализации различных типов векторных данных и алгоритмов, а также может эффективно хранить и запрашивать вложения ИИ, выраженные векторами. PGVector поддерживает точный и приблизительный поиск ближайших соседей, что позволяет быстро получать доступ к аналогичным точкам данных в пространстве с высоким измерениями. Он также поддерживает различные алгоритмы и типы данных по векторам, такие как расстояние L2, внутреннее произведение и косинусальное расстояние, среди прочих. Он подходит для сценариев, когда функция векторного поиска не является ядром системы, или проект быстро запускается на ранней стадии.

Плюсы: PGVector бесшовно интегрируется с существующими базами данных PostgreSQL, позволяя пользователям начинать использовать возможности векторного поиска без миграции существующих баз данных. Поскольку это плагин PostgreSQL, PGVector унаследовал его надёжность и надёжность благодаря долгосрочной разработке и оптимизации PostgreSQL, одновременно улучшая процесс векторизации.
Недостатки: по сравнению с выделенными векторными базами данных оптимизация производительности и использования ресурсов немного недостаточна.

Qdrant

Место:Вход по гиперссылке виден.

Qdrant — это открытая векторная база данных и облачный сервис, запущенный в 2021 году и разработанный для приложений следующего поколения на базе ИИ. Удобные API предоставляются для хранения, поиска и управления точками (то есть векторами) с дополнительными полезными нагрузками для расширения поддержки фильтрации. Множество типов индексов, включая индексы полезной нагрузки, полнотекстовые индексы и векторные индексы, позволяют эффективно обрабатывать данные с большими размерами. Кроме того, Qdrant использует собственный алгоритм HNSW для быстрого и точного поиска и позволяет фильтровать результаты на основе релевантных векторных полезных нагрузок. Эти особенности делают Qdrant полезным для нейронных сетей или семантического сопоставления, многогранного поиска и других приложений. Сильная сторона Qdrant заключается в его функциях семантического поиска и сопоставления сходства, которые позволяют легко реализовывать бизнес-сценарии, такие как поиск по изображениям, голосу и видео, а также системы рекомендаций.

Плюсы: отличная документация, которая помогает разработчикам легко начать работу с Docker. Он полностью построен на Rust и предлагает API, которые разработчики могут использовать через клиенты Rust, Python и Golang, которые сегодня являются самыми популярными для бэкенд-разработчиков. Qdrant поддерживает различные стратегии оптимизации, такие как оптимизация индексов и оптимизация запросов. Также поддерживается распределённое развертывание и горизонтальное масштабирование для удовлетворения потребностей крупномасштабной обработки данных.
Минусы: проект относительно новый и не имеет времени на валидацию. При реагировании на рост объёмов бизнеса он может масштабироваться только горизонтально на уровне сервиса. Поддерживается только статическое шардинг. Согласно отчёту Zilliz, по мере увеличения числа неструктурированных элементов данных в векторных базах данных количество данных значительно увеличивается, и эффективность запросов может пострадать.

Милвус/Зиллиз Клауд

Сайт Milvus:Вход по гиперссылке виден.
Сайт Zilliz:Вход по гиперссылке виден.

Milvus — это открытая чисто векторная база данных 2019 года, построенная на известных библиотеках векторного поиска, таких как FAISS, Annoy и HNSW, и оптимизированная для сценариев, требующих быстрого поиска сходства. Zilliz Cloud — это облачный векторный сервис баз данных, разработанный на базе Milvus, нацеленный на более удобное и высокопроизводительное управление и масштабирование. Короче говоря, Zilliz — это коммерческая версия облачного хостинга Milvus, которая также является более успешной бизнес-моделью в области баз данных.

Плюсы: Благодаря долгому существованию в экосистеме векторных баз данных, база данных очень зрелая и обладает большим количеством алгоритмов. Доступно множество вариантов векторной индексации, и всё построено с нуля в Golang для максимальной масштабируемости. По состоянию на 2023 год это единственный крупный поставщик, предлагающий жизнеспособную реализацию DiskANN, которая считается самой эффективной векторной индексацией дисков.
Минусы: Milvus кажется решением, полностью ориентированным на вопросы масштабируемости — он очень масштабируем благодаря сочетанию прокси, балансировщиков нагрузки, брокеров сообщений, Kafka и Kubernetes 7, что делает всю систему очень сложной и ресурсоемкой. Клиентские API, такие как Python, также менее читаемы и интуитивно понятны, чем новые базы данных, такие как Weaviate и Qdrant, которые обычно больше ориентированы на опыт разработчиков. Milvus создан с целью потоковой передачи данных в векторные индексы для огромной масштабируемости, и во многих случаях Milvus кажется немного избыточным, когда объём данных не слишком велик. Для более статичных и редких крупномасштабных ситуаций альтернативы, такие как Qdrant или Weaviate, могут быть дешевле и быстрее запускать производство.

другой

Redis:Вход по гиперссылке виден.
Шишка:Вход по гиперссылке виден.
Ткачество:Вход по гиперссылке виден.
FAISS:Вход по гиперссылке виден.、Вход по гиперссылке виден.
Elasticsearch:Вход по гиперссылке виден.
SQL Server:Вход по гиперссылке виден.

Ссылка:
Вход по гиперссылке виден.
Вход по гиперссылке виден.
Вход по гиперссылке виден.
Вход по гиперссылке виден.

【AI】(14) Краткое введение в векторные базы данных с открытым исходным кодом

Связанные публикации

Просмотренные разделы