【AI】(14) Короткий вступ до відкритих векторних баз даних

Маленька покидька · Опубліковано 25.03.2025 11:29:25

Вимоги: Минулого разу ми організували вибір моделей вкладення, і при конвертації моделі у вектори потрібно було розглянути збереження векторів. Існує багато векторних баз даних, таких як: LanceDB, Astra DB, Pinecone, Chroma, Weaviate, QDrant, Milvus, Zilliz, PGVector, Redis, Elasticsearch, Redis, FAISS, SQL Server 2025 тощо.

Що таке векторна база даних?

Векторна база даних — це організована колекція векторних вкладень, які включають векторні вкладення, які можна створювати, читати, оновлювати та видаляти у будь-який час. Векторні вкладення представляють блоки даних, такі як текст або зображення, як числові значення. Векторна база даних — це система даних, призначена для зберігання та отримання високовимірних векторів. Він швидко знаходить найближчий цільовий вектор, обчислюючи схожість між векторами (наприклад, косинусна схожість, евклідова відстань тощо). Ця техніка часто використовується для обробки даних на основі вбудовування, таких як представлення тексту, зображень, аудіо або відео ознак.

Векторна база даних — це сукупність даних, збережених у математичній формі. Векторні бази даних полегшують моделям машинного навчання запам'ятовування попередніх даних, що дозволяє використовувати машинне навчання для підтримки таких кейсів, як пошук, рекомендації та генерація тексту. Дані можна ідентифікувати за метриками подібності, а не за точними збігами, що дозволяє комп'ютерним моделям розуміти контекст даних.

Коли клієнт відвідує взуттєвий магазин, продавець може порекомендувати взуття, схоже на те, що подобається клієнту. Аналогічно, при покупках в інтернет-магазині магазин може рекомендувати подібні товари під рубрикою, наприклад, «Клієнт також купив...». Векторні бази даних дозволяють моделям машинного навчання ідентифікувати схожі об'єкти, так само як продавець може знайти схоже взуття, а інтернет-магазин може рекомендувати пов'язані товари. (Насправді магазини електронної комерції можуть використовувати такі моделі машинного навчання для виконання цієї роботи).

Підсумовуючи, векторні бази даних дозволяють комп'ютерним програмам робити порівняння, ідентифікувати зв'язки та розуміти контекст. Це дає змогу створювати передові програми штучного інтелекту (ШІ), такі як великі мовні моделі (LLM).

Хрома

Сайт:Вхід за гіперпосиланням видно.

Chroma — це ефективна база даних з відкритим кодом на основі Python для масштабного пошуку схожості. Він розроблений для вирішення проблеми пошуку подібності у великомасштабних наборах даних, особливо при роботі з високорозмірними даними. Доступно кілька варіантів хостингу: безсерверні/вбудовані, самостійно розміщені (клієнт-серверні) та хмарно-нативні розподілені SaaS-рішення з як вбудованими, так і клієнт-серверними моделями.
Відмінний у прототипуванні та виробничих середовищах. Завдяки ефемерному характеру зберігання даних Chroma ідеально підходить для швидкого прототипування скриптів. Завдяки простому налаштенню користувачі можуть легко створювати колекції та повторно їх використовувати, що полегшує подальше додавання даних. Крім того, Chroma має можливість автоматично завантажувати та зберігати дані. Коли клієнт запускається, він автоматично завантажує дані користувача; Після закриття дані автоматично зберігаються, що значно спрощує процес управління даними. Ця особливість робить Chroma дуже популярною на етапах прототипування та розробки.
Chroma отримала початковий раунд фінансування у травні 2022 року та другий раунд фінансування на суму $1,800.

Переваги: Chroma пропонує клієнтам понад десяток мов програмування, може швидко запускати векторне зберігання і є першою векторною базою даних на ринку, яка за замовчуванням пропонує режим вбудовування. Він відносно дружній до розробників і простий у інтеграції.
Недоліки: Функціональність досить проста, особливо для додатків, які потребують складніших функцій. Підтримується лише CPU-обчислення, що може обмежити приріст продуктивності у ситуаціях, що потребують значних обчислювальних ресурсів.

LanceDB

Сайт:Вхід за гіперпосиланням видно.

LanceDB — це відкрита векторна база даних, розроблена для мультимодальних даних ШІ для зберігання, управління, запитів та отримання великомасштабних мультимодальних вкладень даних. Її основа написана на Rust і побудована на Lance — колонковому форматі даних, який оптимізує високошвидкісний довільний доступ і управління наборами даних ШІ, такими як вектори, документи та зображення. Він підходить для різних застосувань ШІ, які потребують обробки високовимірних векторних даних, таких як розпізнавання зображень, обробка природної мови, рекомендаційні системи тощо. LanceDB пропонує два режими: вбудовані та хмарні сервіси.

Переваги: LanceDB усуває необхідність керувати серверами, знижуючи витрати розробників на експлуатацію та охоплення та підвищуючи ефективність розробки. Він оптимізований для мультимодальних даних і підтримує різні типи даних, такі як зображення, текст і аудіо, що підвищує ефективність роботи бази даних при обробці складних даних. Він забезпечує зручний API та інструменти візуалізації, що дозволяє розробникам легко інтегрувати та використовувати бази даних.
Недоліки: Її запустять лише у 2023 році, це дуже нова база даних, і вона ще недостатньо розвинена з точки зору розвитку функцій та роботи спільноти.

PGVector

Сайт:Вхід за гіперпосиланням видно.

PGVector — це розширення на базі PostgreSQL, розроблене для надання потужних векторних сховищ і можливостей запитів. Він використовує мову C для реалізації різноманітних типів векторних даних і алгоритмів, а також може ефективно зберігати та запитувати вкладення ШІ, виражені у векторах. PGVector підтримує точний і приблизний пошук найближчих сусідів, що дозволяє швидко отримувати доступ до подібних точок даних у великовимірному просторі. Він також підтримує різноманітні алгоритми та типи даних для розрахунку векторів, такі як відстань L2, внутрішній добуток і косинусна відстань, серед інших. Він підходить для ситуацій, коли функція векторного пошуку не є ядром системи, або проєкт швидко запускається на ранній стадії.

Переваги: PGVector безшовно інтегрується з існуючими базами даних PostgreSQL, дозволяючи користувачам починати використовувати векторний пошук без міграції існуючих баз даних. Оскільки це плагін PostgreSQL, PGVector успадковує його надійність і надійність завдяки довгостроковій розробці та оптимізації PostgreSQL, одночасно покращуючи обробку векторизації.
Недоліки: Порівняно з виділеними векторними базами даних, оптимізація продуктивності та використання ресурсів трохи недостатня.

Qdrant

Сайт:Вхід за гіперпосиланням видно.

Qdrant — це векторна база даних з відкритим кодом, а також сервіс, розміщений у хмарі, запущений у 2021 році та розроблений для додатків наступного покоління на базі ШІ. Зручні API надаються для зберігання, пошуку та керування точками (тобто векторами) з додатковими корисними навантаженнями для розширення підтримки фільтрації. Кілька типів індексів, включно з індексами корисного навантаження, повнотекстовими та векторними індексами, дозволяють ефективно обробляти високорозмірні дані. Крім того, Qdrant використовує власний алгоритм HNSW для швидких і точних пошуків і дозволяє фільтрувати результати на основі релевантних векторних корисних навантажень. Ці особливості роблять Qdrant корисним для нейронних мереж або семантичного підбору, багатогранного пошуку та інших застосувань. Сила Qdrant полягає у його семантичному пошуку та функціях відповідності подібності, які полегшують реалізацію бізнес-сценаріїв, таких як пошук зображень, голос і відео, а також системи рекомендацій.

Плюси: Відмінна документація, яка допомагає розробникам легко запускати Docker. Вона повністю побудована на Rust і пропонує API, які розробники можуть використовувати через його клієнти Rust, Python і Golang, які сьогодні є найпопулярнішими мовами для бекенд-розробників. Qdrant підтримує різні стратегії оптимізації, такі як оптимізація індексу та оптимізація запитів. Він також підтримує розподілене розгортання та горизонтальне масштабування для задоволення потреб у великомасштабній обробці даних.
Мінуси: Проєкт відносно новий і не має достатньо часу на валідацію. Реагуючи на зростання обсягів бізнесу, вона може масштабуватися лише горизонтально на рівні сервісу. Підтримується лише статичне шардинг. Згідно зі звітом Зілліза, зі зростанням кількості неструктурованих елементів даних у векторних базах даних обсяг збережених даних стає великим, і ефективність запитів може постраждати.

Мілвус/Зілліз Клауд

Вебсайт Milvus:Вхід за гіперпосиланням видно.
Вебсайт Zilliz:Вхід за гіперпосиланням видно.

Milvus — це відкрита чисто векторна база даних 2019 року, побудована на відомих бібліотеках векторного пошуку, таких як FAISS, Annoy та HNSW, і оптимізована для сценаріїв, що потребують швидкого пошуку подібності. Zilliz Cloud — це хмарна векторна база даних, розроблена на базі Milvus, яка має на меті забезпечити більш зручне та високопродуктивне управління та масштабування. Коротко кажучи, Zilliz — це комерційна версія хмарного хостингу Milvus, яка також є більш успішною бізнес-моделлю у сфері баз даних.

Переваги: Завдяки тривалому існування в екосистемі векторних баз даних, база даних дуже зріла і має велику кількість алгоритмів. Доступно багато варіантів векторного індексування, і все створено з нуля в Golang для максимальної масштабованості. Станом на 2023 рік це єдиний масовий виробник, який пропонує життєздатну реалізацію DiskANN, яка вважається найефективнішою індексацією векторів дисків.
Мінуси: Milvus здається рішенням, яке повністю зосереджується на питаннях масштабованості — воно дуже масштабоване завдяки комбінації проксі, балансувальників навантаження, брокерів повідомлень, Kafka та Kubernetes 7, що робить всю систему дуже складною та ресурсомісткою. Клієнтські API, такі як Python, також менш читабельні та інтуїтивно зрозумілі, ніж новіші бази даних, як Weaviate і Qdrant, які більше орієнтовані на досвід розробників. Milvus створений з ідеєю потокового потоку даних у векторні індекси для величезної масштабованості, і в багатьох випадках Milvus здається трохи надмірним, коли обсяг даних не надто великий. Для більш статичних і рідкісних масштабних ситуацій альтернативи, такі як Qdrant або Weaviate, можуть бути дешевшими і швидше запускати виробництво.

інший

Редіс:Вхід за гіперпосиланням видно.
Шишка:Вхід за гіперпосиланням видно.
Ткати:Вхід за гіперпосиланням видно.
ФЕЙСС:Вхід за гіперпосиланням видно.、Вхід за гіперпосиланням видно.
Elasticsearch:Вхід за гіперпосиланням видно.
SQL Server:Вхід за гіперпосиланням видно.

Посилання:
Вхід за гіперпосиланням видно.
Вхід за гіперпосиланням видно.
Вхід за гіперпосиланням видно.
Вхід за гіперпосиланням видно.

【AI】(14) Короткий вступ до відкритих векторних баз даних

Пов'язані дописи

Переглянуті розділи