【AI】(14) En kort introduktion til open source vektordatabaser

Lille skarn · Opslået på 25/03/2025 11.29.25

Krav: Sidste gang organiserede vi udvælgelsen af indlejringsmodeller, og når modellen konverteres til vektorer, skal vi overveje at gemme vektorerne. Der findes mange vektordatabaser, såsom: LanceDB, Astra DB, Pinecone, Chroma, Weaviate, QDrant, Milvus, Zilliz, PGVector, Redis, Elasticsearch, Redis, FAISS, SQL Server 2025 osv.

Hvad er en vektordatabase?

En vektordatabase er en organiseret samling af vektorindlejringer, der indeholder vektorindlejringer, som kan oprettes, læses, opdateres og slettes når som helst. Vektorindlejringer repræsenterer datablokke, såsom tekst eller billeder, som numeriske værdier. En vektordatabase er et databasesystem designet til at gemme og hente højdimensionelle vektorer. Den finder hurtigt den nærmeste målvektor ved at beregne ligheden mellem vektorer (såsom cosinuslighed, euklidisk afstand osv.). Denne teknik bruges ofte til at behandle embedding-baserede data, såsom tekst, billeder, lyd- eller videofunktionsrepræsentationer.

En vektordatabase er en samling af data, der er lagret i matematisk form. Vektordatabaser gør det lettere for maskinlæringsmodeller at huske tidligere input, hvilket gør det muligt at bruge maskinlæring til at understøtte brugsscenarier som søgning, anbefaling og tekstgenerering. Data kan identificeres baseret på lighedsmålinger frem for nøjagtige match, hvilket gør det muligt for computermodeller at forstå dataenes kontekst.

Når en kunde besøger en skobutik, kan sælgeren anbefale sko, der ligner den, kunden kan lide. På samme måde kan butikken, når man handler i en e-handelsbutik, anbefale lignende varer under overskrifter som "Kunden har også købt...". Vektordatabaser gør det muligt for maskinlæringsmodeller at identificere lignende objekter, ligesom en sælger kan finde lignende sko, og en e-handelsbutik kan anbefale relaterede produkter. (Faktisk kan e-handelsbutikker bruge sådanne maskinlæringsmodeller til at udføre opgaven).

Afslutningsvis gør vektordatabaser det muligt for computerprogrammer at foretage sammenligninger, identificere relationer og forstå kontekst. Dette gør det muligt at skabe avancerede kunstig intelligens (AI)-programmer såsom store sprogmodeller (LLM'er).

Chroma

Websted:Hyperlink-login er synlig.

Chroma er en effektiv, Python-baseret, open source-database til store lighedssøgninger. Den er designet til at løse problemet med lighedssøgninger i store datasæt, især når der arbejdes med data i høj dimension. Flere hostingmuligheder er tilgængelige: serverløse/indbyggede, selvhostede (klient-server) og cloud-native distribuerede SaaS-løsninger med både indlejrede og klient-server-modeller.
Fremragende i prototype- og produktionsmiljøer. På grund af den flygtige karakter af datalagringen er Chroma ideel til hurtig prototyping af scripts. Med simpel opsætning kan brugere nemt oprette samlinger og genbruge dem, hvilket muliggør efterfølgende datatilføjelser. Derudover har Chroma mulighed for automatisk at indlæse og gemme data. Når klienten startes, indlæser den automatisk brugerens data; Når dataene lukkes, gemmes de automatisk, hvilket i høj grad forenkler datahåndteringsprocessen. Denne funktion gør Chroma meget populær under prototype- og udviklingsfaserne.
Chroma modtog en seed-runde af finansiering i maj 2022 og en anden runde på 1.800 dollars i finansiering.

Fordele: Chroma tilbyder klienter til mere end et dusin programmeringssprog, kan hurtigt starte vektorlagring og er den første vektordatabase på markedet, der tilbyder embedding-tilstand som standard. Det er relativt udviklervenligt og nemt at integrere.
Ulemper: Funktionaliteten er relativt enkel, især for applikationer, der kræver mere komplekse funktioner. Kun CPU-beregning understøttes, hvilket kan begrænse ydelsesgevinster i situationer, der kræver betydelige beregningsressourcer.

LanceDB

Websted:Hyperlink-login er synlig.

LanceDB er en open source vektordatabase designet til multimodal AI-data til lagring, håndtering, forespørgsler og hentning af store multimodale dataindlejringer. Kernen er skrevet i Rust og bygget på Lance, et kolonneformat data, der optimerer hurtig tilfældig adgang og håndtering af AI-datasæt såsom vektorer, dokumenter og billeder. Den er velegnet til forskellige AI-applikationer, der skal behandle højdimensionelle vektordata, såsom billedgenkendelse, naturlig sprogbehandling, anbefalingssystemer osv. LanceDB tilbyder to tilstande: indlejrede og cloud-hostede tjenester.

Fordele: LanceDB eliminerer behovet for at administrere servere, hvilket reducerer udviklernes O&M-omkostninger og forbedrer udviklingseffektiviteten. Den er optimeret til multimodale data og understøtter forskellige datatyper såsom billeder, tekst og lyd, hvilket forbedrer databasens effektivitet ved håndtering af komplekse data. Det tilbyder en brugervenlig API-grænseflade og visualiseringsværktøjer, der gør det nemt for udviklere at integrere og bruge databaser.
Ulemper: Den vil først blive lanceret i 2023, hvilket er en meget ny database, og den er ikke moden nok, når det gælder funktionsudvikling og fællesskabsdrift.

PGVector

Websted:Hyperlink-login er synlig.

PGVector er en PostgreSQL-baseret udvidelse designet til at levere kraftfulde vektorlagrings- og forespørgselsmuligheder. Det bruger C-sproget til at implementere en række vektordatatyper og algoritmer og kan effektivt gemme og forespørge AI-indlejringer udtrykt i vektorer. PGVector understøtter præcis og tilnærmet nærmeste nabo-søgning, hvilket muliggør hurtig adgang til lignende datapunkter i højdimensionelt rum. Den understøtter også en række vektorberegningsalgoritmer og datatyper, såsom L2-afstand, indre produkt og cosinusafstand, blandt andre. Den er velegnet til scenarier, hvor vektorsøgningsfunktionen ikke er kernen i systemet, eller hvor projektet hurtigt igangsættes i den tidlige fase.

Fordele: PGVector integreres problemfrit i eksisterende PostgreSQL-databaser, hvilket gør det muligt for brugere at begynde at bruge vektorsøgningsfunktioner uden at migrere eksisterende databaser. Da det er et PostgreSQL-plugin, arver PGVector sin pålidelighed og robusthed med hjælp fra PostgreSQLs langsigtede udvikling og optimering, samtidig med at vektoriseringsbehandlingen forbedres.
Ulemper: Sammenlignet med dedikerede vektordatabaser er optimeringen af ydeevne og ressourceudnyttelse en smule utilstrækkelig.

Qdrant

Websted:Hyperlink-login er synlig.

Qdrant er en open source vektordatabase og cloud-hostet tjeneste, lanceret i 2021 og designet til næste generations AI-applikationer. Bekvemme API'er leveres til at lagre, søge og administrere punkter (dvs. vektorer) med ekstra payloads for at udvide filtreringsunderstøttelse. De mange indekstyper, herunder nyttelastindekser, fuldtekstindekser og vektorindekser, gør det muligt effektivt at håndtere højdimensionelle data. Derudover bruger Qdrant en specialudviklet HNSW-algoritme til hurtige og præcise søgninger og tillader filtrering af resultater baseret på relevante vektor-payloads. Disse funktioner gør Qdrant nyttigt til neurale netværk eller semantisk baseret matchning, multifacetteret søgning og andre applikationer. Qdrants styrke ligger i dets funktioner for semantisk søgning og lighedsmatchning, som gør det nemt at implementere forretningsscenarier som billed-, stemme- og videosøgning samt anbefalingssystemer.

Fordele: Fremragende dokumentation, der hjælper udviklere med nemt at komme i gang med Docker. Det er bygget udelukkende i Rust og tilbyder API'er, som udviklere kan bruge gennem dets Rust-, Python- og Golang-klienter, som er de mest populære sprog for backend-udviklere i dag. Qdrant understøtter forskellige optimeringsstrategier, såsom indeksoptimering og forespørgselsoptimering. Den understøtter også distribueret implementering og horisontal skalering for at imødekomme behovene for storskala databehandling.
Ulemper: Projektet er relativt nyt og har ikke nok tid til at validere. Når man reagerer på væksten i forretningsvolumen, kan den kun skalere horisontalt på serviceniveauet. Kun statisk sharding understøttes. Ifølge Zilliz' rapport er mængden af lagrede data stor, efterhånden som antallet af ustrukturerede dataelementer i vektordatabaser vokser, og forespørgselseffektiviteten kan blive påvirket.

Milvus/Zilliz Cloud

Milvus hjemmeside:Hyperlink-login er synlig.
Zilliz hjemmeside:Hyperlink-login er synlig.

Milvus er en open source ren vektordatabase fra 2019, bygget på velkendte vektorsøgningsbiblioteker som FAISS, Annoy og HNSW, og optimeret til scenarier, der kræver hurtige lighedssøgninger. Zilliz Cloud er en cloud-native vektordatabasetjeneste udviklet baseret på Milvus, med det formål at tilbyde mere bekvemme og højtydende styrings- og skaleringsmuligheder. Kort sagt er Zilliz en kommerciel version af Milvus' cloud-hosting, som også er en mere succesfuld forretningsmodel inden for databaseområdet.

Fordele: På grund af dens lange eksistens i vektordatabaseøkosystemet er databasen meget moden og har et stort antal algoritmer. Der findes mange vektorindekseringsmuligheder, og det er bygget fra bunden i Golang for ekstrem skalerbarhed. Pr. 2023 er det den eneste mainstream-leverandør, der tilbyder en levedygtig DiskANN-implementering, som siges at være den mest effektive diskvektorindeksering.
Ulemper: Milvus virker som en løsning, der går all-in på skalerbarhedsproblemer – det er meget skalerbart gennem en kombination af proxyer, load balancere, message brokers, Kafka og Kubernetes 7, hvilket gør hele systemet meget komplekst og ressourcekrævende. Client-side API'er, såsom Python, er heller ikke lige så læsbare eller intuitive som nyere databaser som Weaviate og Qdrant, som ofte fokuserer mere på udvikleroplevelsen. Milvus er bygget med idéen om at streame data til vektorindekser for massiv skalerbarhed, og i mange tilfælde virker Milvus lidt overkill, når datamængden ikke er for stor. For mere statiske og sjældne storskala-situationer kan alternativer som Qdrant eller Weaviate være billigere og kan komme hurtigere i produktion.

anden

Redis:Hyperlink-login er synlig.
Pinecone:Hyperlink-login er synlig.
Weaviate:Hyperlink-login er synlig.
FAISS:Hyperlink-login er synlig.、Hyperlink-login er synlig.
Elasticsearch:Hyperlink-login er synlig.
SQL Server:Hyperlink-login er synlig.

Henvisning:
Hyperlink-login er synlig.
Hyperlink-login er synlig.
Hyperlink-login er synlig.
Hyperlink-login er synlig.

【AI】(14) En kort introduktion til open source vektordatabaser

Relaterede indlæg

Afsnit set