Tillämpningsscenarier
En tidsseriedatabas (TSDB) är en databas optimerad för att bearbeta tidsstämplade kontinuerliga dataströmmar såsom IoT-sensoravläsningar, servermetrik och finansiella transaktioner. Den är speciellt utformad för högfrekvent skrivning av enorma data samt snabb aggregering och frågeställande baserat på tidsdimensionen.
I Internet of Everything-eran är mängden data som genereras av Industrial Internet of Things tusentals eller till och med tiotusentals gånger större än vid traditionell informatisering, och det är realtidsinsamling, hög frekvens, hög densitet, och den dynamiska datamodellen kan ändras när som helst. Traditionella databaser är utsträckta i lagring, förfrågan, analys och andra bearbetningsoperationer av dessa data, och det finns ett akut behov av ett databassystem optimerat för tidsseriedata, det vill säga tidsseriedatabaser.
Tidsseriedatabas är en specialiserad databas för lagring och hantering av tidsseriedata, med egenskaper som att skriva mer och läsa mindre, distinktion mellan varm och kall skrivning, hög samtidighet skrivning, inga transaktionskrav och kontinuerlig skrivning av massiv data.
Egenskaper hos tidsseriedata
Tidsstämpel: Varje datapunkt är tidsstämplad, vilket är viktigt för databeräkning och analys. Strukturerad: Till skillnad från den massiva datan från webbcrawlers, Weibo och WeChat, är datan som genereras av nätverksanslutna enheter eller övervakningssystem strukturerad. Dessa data har fördefinierade datatyper eller fasta längder, såsom ström och spänning som samlas in av smarta mätare, vilka kan uttryckas i ett standardiserat flyttalstal på 4 byte. Strömning: Datakällor genererar data i ungefär konstant takt, såsom ljud- eller videoströmmar. Dessa dataströmmar är oberoende av varandra. Smidig och förutsägbar trafik: Till skillnad från data från e-handelsplattformar eller sociala medier är trafiken för tidsseriedata stabil över tid och kan beräknas och förutsägas baserat på antalet datakällor och urvalsperioder. Oföränderlighet: Tidsseriedata är vanligtvis endast append, liknande loggdata, och är i allmänhet inte tillåtet och behöver inte ändras. Det finns få situationer där ändringar i den insamlade rådatan krävs.
Ranking
Adress:Inloggningen med hyperlänken är synlig.De senaste rankningarna är följande:
databas
1、InfluxDB
InfluxDB är en öppen källkod distribuerad databas för tidsserier, händelser och metriska mått skriven i Go-språket utan externa beroenden. Databasen används nu främst för att lagra stora mängder tidsstämplade data såsom DevOps-övervakningsdata, APP-mätvärden, loT-sensordata och realtidsanalysdata.
Som den högst rankade open source-tidsseriedatabasen stöder InfluxDB datalagringspolicy (RP) och dataarkivering (CQ), som kan frågas i realtid, och data kan hittas omedelbart efter att ha indexerats när den skrivs.
2、Kdb+
Officiellt känd som världens snabbaste tidsseriedatabas använder kdb+/q en enhetlig databas för att bearbeta realtidsdata och historisk data, och har funktioner som CEP-motor (komplex händelsebearbetning), minnesdatabas och diskdatabas. Egenskaperna hos kolumnlagring gör det extremt bekvämt att utföra statistisk analys av en viss kolumn.
Jämfört med allmänna databaser eller big data-plattformar har kdb+/q snabbare hastighet och lägre total ägandekostnad, vilket gör det idealiskt för massiv databehandling, främst använd inom massiv dataanalys, högfrekvenshandel, artificiell intelligens, Internet of Things och andra områden. Inom finanssektorn, där latens är krävande, har kdb+ en unik fördel.
3、Prometheus
Prometheus är ett öppen källkodsramverk för systemövervakning och larm skapat av tidigare Google-anställda på SoundCloud 2012 och utvecklat som ett community open source-projekt, officiellt släppt 2015 och officiellt anslöt sig till Cloud Native Computing Foundation året därpå.
Som en ny generation av övervakningsramverk har Prometheus en kraftfull multidimensionell datamodell, en mängd visuella grafiska gränssnitt och använder pull-läge för att samla in tidsseriedata, vilka kan skickas till Prometheus-servern i form av push gateway.
4、 Grafit
Graphite är ett öppet realtidsdiagram som visar data för tidsseriemätningar. Graphite samlar inte in mätvärdena själva, utan fungerar som en databas som tar emot dem via sin backend och sedan söker, transformerar och kombinerar dem i realtid.
Graphite stöder ett inbyggt webbgränssnitt som gör det möjligt för användare att bläddra bland mätdata och grafer. Den består av flera back-end och front-end-komponenter. Backend-komponenten används för att lagra numeriska tidsseriedata, medan front-end-komponenten används för att erhålla metriska objektdata och rendera diagram baserat på situationen.
5、TimescaleDB
TimescaleDB är den enda öppna källkodsdatabasen för tidsserier som stödjer full SQL och är optimerad för snabb extraktion och komplexa frågor som stöder full SQL. Det är baserat på PostgreSQL och erbjuder det bästa från NoSQL och relationsvärldar för tidsseriedata.
TimescaleDB gör det möjligt för utvecklare och organisationer att dra ännu mer nytta av dess kapaciteter: analysera det förflutna, förstå nuet och förutsäga framtiden. Att förena tidsserie- och relationsdata på frågenivå eliminerar datasilos och gör demos och prototyper enklare att implementera. Kombinationen av skalbarhet och ett komplett SQL-gränssnitt ger anställda möjlighet att ställa datafrågor. |