【AI】(14) En kort introduksjon til åpen kildekode-vektordatabaser

Lille skurk · Publisert på 25.03.2025 11:29:25

Krav: Forrige gang organiserte vi valget av embedding-modeller, og når vi konverterer modellen til vektorer, må vi vurdere å lagre vektorene. Det finnes mange vektordatabaser, som: LanceDB, Astra DB, Pinecone, Chroma, Weaviate, QDrant, Milvus, Zilliz, PGVector, Redis, Elasticsearch, Redis, FAISS, SQL Server 2025, osv.

Hva er en vektordatabase?

En vektordatabase er en organisert samling av vektorinnlegginger som inkluderer vektorinnlegg som kan opprettes, leses, oppdateres og slettes når som helst. Vektorinnlegginger representerer datablokker, som tekst eller bilder, som numeriske verdier. En vektordatabase er et databasesystem designet for å lagre og hente høydimensjonale vektorer. Den finner raskt den nærmeste målvektoren ved å beregne likheten mellom vektorer (som cosinuslikhet, euklidsk avstand, osv.). Denne teknikken brukes ofte til å behandle embedding-baserte data, som tekst, bilder, lyd- eller videofunksjonsrepresentasjoner.

En vektordatabase er en samling data lagret i matematisk form. Vektordatabaser gjør det enklere for maskinlæringsmodeller å huske tidligere input, noe som gjør det mulig å bruke maskinlæring til å støtte bruksområder som søk, anbefaling og tekstgenerering. Data kan identifiseres basert på likhetsmålinger i stedet for eksakte treff, noe som gjør at datamodeller kan forstå konteksten i dataene.

Når en kunde besøker en skobutikk, kan selgeren anbefale sko som ligner på den kunden liker. På samme måte, når man handler i en nettbutikk, kan butikken anbefale lignende varer under overskrifter som «Kunden har også kjøpt...». Vektordatabaser gjør det mulig for maskinlæringsmodeller å identifisere lignende objekter, akkurat som en selger kan finne lignende sko, og en nettbutikk kan anbefale relaterte produkter. (Faktisk kan nettbutikker bruke slike maskinlæringsmodeller for å gjøre jobben).

Avslutningsvis gjør vektordatabaser det mulig for dataprogrammer å sammenligne, identifisere relasjoner og forstå kontekst. Dette gjør det mulig å lage avanserte kunstig intelligens (AI)-programmer som store språkmodeller (LLM).

Chroma

Tomt:Innloggingen med hyperkoblingen er synlig.

Chroma er en effektiv, Python-basert, åpen kildekode-database for storskala likhetssøk. Den er designet for å løse problemet med likhetssøk i store datasett, spesielt når man arbeider med høydimensjonale data. Flere hostingalternativer er tilgjengelige: serverløs/innebygd, selvhostet (klient-server), og skybaserte distribuerte SaaS-løsninger med både innebygde og klient-server-modeller.
Utmerket i prototype- og produksjonsmiljøer. På grunn av den flyktige naturen til datalagringen, er Chroma ideell for rask prototyping av skript. Med enkel oppsett kan brukere enkelt opprette samlinger og gjenbruke dem, noe som muliggjør påfølgende datatilførsler. I tillegg har Chroma muligheten til automatisk å laste inn og lagre data. Når klienten startes, laster den automatisk brukerens data; Når dataene lukkes, lagres de automatisk, noe som forenkler databehandlingsprosessen betydelig. Denne funksjonen gjør Chroma svært populært under prototype- og utviklingsfasene.
Chroma mottok en startrunde i mai 2022 og en andre runde på 1 800 dollar i finansiering.

Fordeler: Chroma tilbyr klienter for mer enn et dusin programmeringsspråk, kan raskt starte vektorlagring, og er den første vektordatabasen på markedet som tilbyr innebygd modus som standard. Det er relativt utviklervennlig og enkelt å integrere.
Ulemper: Funksjonaliteten er relativt enkel, spesielt for applikasjoner som krever mer komplekse funksjoner. Kun CPU-beregning støttes, noe som kan begrense ytelsesgevinster i situasjoner som krever betydelige beregningsressurser.

LanceDB

Tomt:Innloggingen med hyperkoblingen er synlig.

LanceDB er en åpen kildekode-vektordatabase designet for multimodal AI-data for lagring, håndtering, forespørsler og henting av storskala multimodale datainnbeddinger. Kjernen er skrevet i Rust og bygget på Lance, et kolonneformat som optimaliserer rask tilfeldig tilgang og håndtering av AI-datasett som vektorer, dokumenter og bilder. Den er egnet for ulike AI-applikasjoner som trenger å behandle høydimensjonale vektordata, som bildegjenkjenning, naturlig språkbehandling, anbefalingssystemer osv. LanceDB tilbyr to moduser: innebygde og skybaserte tjenester.

Fordeler: LanceDB eliminerer behovet for å administrere servere, reduserer utviklernes O&M-kostnader og forbedrer utviklingseffektiviteten. Den er optimalisert for multimodale data og støtter ulike datatyper som bilder, tekst og lyd, noe som forbedrer effektiviteten til databasen ved håndtering av komplekse data. Den tilbyr et brukervennlig API-grensesnitt og visualiseringsverktøy, som gjør det enkelt for utviklere å integrere og bruke databaser.
Ulemper: Den vil først bli lansert i 2023, som er en veldig ny database, og den er ikke moden nok når det gjelder funksjonsutvikling og fellesskapsdrift.

PGVector

Tomt:Innloggingen med hyperkoblingen er synlig.

PGVector er en PostgreSQL-basert utvidelse designet for å tilby kraftige vektorlagrings- og spørringsmuligheter. Den bruker C-språket for å implementere ulike vektordatatyper og algoritmer, og kan effektivt lagre og spørre AI-innleiringer uttrykt i vektorer. PGVector støtter presis og omtrentlig søk etter nærmeste nabo, noe som gir rask tilgang til lignende datapunkter i høydimensjonalt rom. Den støtter også en rekke vektorberegningsalgoritmer og datatyper, som L2-avstand, indre produkt og cosinusavstand, blant andre. Den egner seg for situasjoner der vektorsøkefunksjonen ikke er kjernen i systemet, eller hvor prosjektet raskt settes i gang i en tidlig fase.

Fordeler: PGVector integreres sømløst i eksisterende PostgreSQL-databaser, slik at brukere kan begynne å bruke vektorsøk uten å måtte migrere eksisterende databaser. Siden det er en PostgreSQL-plugin, arver PGVector sin pålitelighet og robusthet ved hjelp av PostgreSQLs langsiktige utvikling og optimalisering, samtidig som det forbedrer vektoriseringsprosesseringen.
Ulemper: Sammenlignet med dedikerte vektordatabaser er optimaliseringen av ytelse og ressursutnyttelse litt utilstrekkelig.

Qdrant

Tomt:Innloggingen med hyperkoblingen er synlig.

Qdrant er en åpen kildekode vektordatabase og skybasert tjeneste lansert i 2021 og designet for neste generasjons AI-applikasjoner. Praktiske API-er tilbys for å lagre, søke og administrere punkter (dvs. vektorer) med ekstra nyttelaster for å utvide filtreringsstøtten. De flere indekstypene, inkludert nyttelastindekser, fulltekstindekser og vektorindekser, gjør det mulig å håndtere høydimensjonale data effektivt. I tillegg bruker Qdrant en tilpasset HNSW-algoritme for raske og nøyaktige søk, og tillater filtrering av resultater basert på relevante vektorlaster. Disse funksjonene gjør Qdrant nyttig for nevrale nettverk eller semantiskbasert matching, flerfasettert søk og andre applikasjoner. Qdrants styrke ligger i dets semantiske søk og likhetsmatching, som gjør det enkelt å implementere forretningsscenarier som bilde-, tale- og videosøk, samt anbefalingssystemer.

Fordeler: Utmerket dokumentasjon som hjelper utviklere med å komme i gang med Docker enkelt. Det er bygget helt i Rust og tilbyr API-er som utviklere kan bruke gjennom sine Rust-, Python- og Golang-klienter, som er de mest populære språkene for backend-utviklere i dag. Qdrant støtter ulike optimaliseringsstrategier, som indeksoptimalisering og spørringsoptimalisering. Den støtter også distribuert distribusjon og horisontal skalering for å møte behovene til storskala databehandling.
Ulemper: Prosjektet er relativt nytt og har ikke nok tid til å validere. Når man svarer på veksten i forretningsvolum, kan det bare skalere horisontalt på tjenestenivå. Kun statisk sharding støttes. Ifølge Zilliz' rapport, ettersom antallet ustrukturerte dataelementer i vektordatabaser øker, blir mengden lagret stor og spørringseffektiviteten kan bli påvirket.

Milvus/Zilliz Cloud

Milvus-nettsiden:Innloggingen med hyperkoblingen er synlig.
Zilliz nettside:Innloggingen med hyperkoblingen er synlig.

Milvus er en åpen kildekode ren vektordatabase fra 2019 bygget på velkjente vektorsøkebiblioteker som FAISS, Annoy og HNSW, og optimalisert for scenarioer som krever raske likhetssøk. Zilliz Cloud er en skybasert vektordatabasetjeneste utviklet basert på Milvus, med mål om å tilby mer praktiske og høyytelses administrasjons- og skaleringsmuligheter. Kort sagt er Zilliz en kommersiell versjon av Milvus' skyhosting, som også er en mer vellykket forretningsmodell innen databasefeltet.

Fordeler: På grunn av sin lange eksistens i vektordatabaseøkosystemet, er databasen svært moden og har et stort antall algoritmer. Det finnes mange vektorindekseringsalternativer, og det er bygget fra bunnen av i Golang for ekstrem skalerbarhet. Per 2023 er det den eneste hovedstrømsleverandøren som tilbyr en levedyktig DiskANN-implementering, som sies å være den mest effektive diskvektorindekseringen.
Ulemper: Milvus virker å være en løsning som satser fullt ut på skalerbarhetsproblemer – det er svært skalerbart gjennom en kombinasjon av proxyer, lastbalanserere, meldingsmeglere, Kafka og Kubernetes 7, noe som gjør hele systemet svært komplekst og ressurskrevende. Klientside-API-er, som Python, er heller ikke like lesbare eller intuitive som nyere databaser som Weaviate og Qdrant, som ofte fokuserer mer på utvikleropplevelsen. Milvus er bygget med ideen om å strømme data til vektorindekser for massiv skalerbarhet, og i mange tilfeller virker Milvus litt overkill når datamengden ikke er for stor. For mer statiske og sjeldne storskala situasjoner kan alternativer som Qdrant eller Weaviate være billigere og kan komme i gang raskere i produksjon.

annen

Redis:Innloggingen med hyperkoblingen er synlig.
Furukongle:Innloggingen med hyperkoblingen er synlig.
Weaviate:Innloggingen med hyperkoblingen er synlig.
FAISS:Innloggingen med hyperkoblingen er synlig.、Innloggingen med hyperkoblingen er synlig.
Elasticsearch:Innloggingen med hyperkoblingen er synlig.
SQL Server:Innloggingen med hyperkoblingen er synlig.

Referanse:
Innloggingen med hyperkoblingen er synlig.
Innloggingen med hyperkoblingen er synlig.
Innloggingen med hyperkoblingen er synlig.
Innloggingen med hyperkoblingen er synlig.

【AI】(14) En kort introduksjon til åpen kildekode-vektordatabaser

Relaterte innlegg

Seksjoner sett