Bruksscenarier
En tidsseriedatabase (TSDB) er en database optimalisert for behandling av tidsstemplede kontinuerlige datastrømmer som IoT-sensoravlesninger, servermetrikker og finansielle transaksjoner. Den er spesielt utviklet for høyfrekvent skriving av enorme datamengder og rask aggregering og spørring basert på tidsdimensjonen.
I Internett av Alt er mengden data generert av det industrielle tingenes internett tusenvis eller til og med titusenvis av ganger større enn ved tradisjonell informatisering, og det er sanntidsinnsamling, høy frekvens, høy tetthet, og den dynamiske datamodellen kan endres når som helst. Tradisjonelle databaser er strukket tynt i lagring, spørring, analyse og andre prosesseringsoperasjoner av disse dataene, og det er et akutt behov for et databasesystem optimalisert for tidsseriedata, det vil si tidsseriedatabaser.
Tidsseriedatabase er en spesialisert database for lagring og håndtering av tidsseriedata, med egenskaper som å skrive mer og lese mindre, forskjellen mellom varm og kald, høy samtidig skriving, ingen transaksjonskrav og kontinuerlig skriving av enorme data.
Egenskaper ved tidsseriedata
Tidsstempel: Hvert datapunkt er tidsstemplet, noe som er viktig for databeregning og analyse. Strukturert: I motsetning til de enorme dataene fra nettcrawlere, Weibo og WeChat, er dataene som genereres av nettverksbaserte enheter eller overvåkingssystemer strukturerte. Disse dataene har forhåndsdefinerte datatyper eller faste lengder, som strøm og spenning samlet inn av smarte målere, som kan uttrykkes i et standard flyttallsantall på 4 byte. Strømming: Datakilder genererer data med omtrent konstant hastighet, som lyd- eller videostrømmer. Disse datastrømmene er uavhengige av hverandre. Jevn og forutsigbar trafikk: I motsetning til data fra netthandelsplattformer eller sosiale medier, er trafikken til tidsseriedata stabil over tid og kan beregnes og forutsies basert på antall datakilder og utvalgsperioder. Uforanderlighet: Tidsseriedata kan vanligvis kun legges til, likt loggdata, og er vanligvis ikke tillatt og trenger ikke å endres. Det finnes få situasjoner hvor det kreves endringer i rådataene som samles inn.
Rangering
Adresse:Innloggingen med hyperkoblingen er synlig.De siste rangeringene er som følger:
database
1、InfluxDB
InfluxDB er en åpen kildekode distribuert tidsserie-, hendelses- og metrikkdatabase skrevet i Go-språket uten eksterne avhengigheter. Databasen brukes nå primært til å lagre store mengder tidsstemplede data som DevOps-overvåkingsdata, APP-målinger, LoT-sensordata og sanntidsanalysedata.
Som den høyest rangerte åpne kildekode-tidsseriedatabasen støtter InfluxDB datalagringspolicy (RP) og dataarkivering (CQ), som kan forespørres i sanntid, og dataene kan umiddelbart finnes etter indeksering når de er skrevet.
2、Kdb+
Offisielt kjent som verdens raskeste tidsseriedatabase, bruker kdb+/q en samlet database for å behandle sanntidsdata og historiske data, og har funksjoner som CEP (complex event processing)-motor, minnedatabase og diskdatabase. Egenskapene til kolonnelagring gjør det svært praktisk å utføre statistisk analyse av en bestemt kolonne.
Sammenlignet med generelle databaser eller store dataplattformer har kdb+/q høyere hastighet og lavere totale eierkostnader, noe som gjør det ideelt for massiv databehandling, hovedsakelig brukt i omfattende dataanalyse, høyfrekvenshandel, kunstig intelligens, tingenes internett og andre felt. I finanssektoren, hvor latenstiden er krevende, har kdb+ en unik fordel.
3、Prometheus
Prometheus er et åpen kildekode-rammeverk for systemovervåking og alarm, laget av tidligere Google-ansatte som jobbet hos SoundCloud i 2012 og utviklet som et fellesskapsprosjekt med åpen kildekode, offisielt lansert i 2015, og ble offisielt medlem av Cloud Native Computing Foundation året etter.
Som en ny generasjon overvåkingsrammeverk har Prometheus en kraftig flerdimensjonal datamodell, en rekke visuelle grafiske grensesnitt, og bruker pull-modus for å samle tidsseriedata, som kan sendes til Prometheus-serveren i form av push-gateway.
4、 Grafitt
Graphite er et åpen kildekode sanntids grafsystem som viser data for tidsseriemålinger. Grafitt samler ikke inn metrikkene selv, men fungerer som en database som mottar dem gjennom backend og deretter spør, transformerer og kombinerer dem i sanntid.
Graphite støtter et innebygd webgrensesnitt som lar brukere bla gjennom måledata og grafer. Den består av flere back-end og front-end komponenter. Backend-komponenten brukes til å lagre numeriske tidsseriedata, mens front-end-komponenten brukes til å hente metriske itemdata og gjengi diagrammer basert på situasjonen.
5、TimescaleDB
TimescaleDB er den eneste åpen kildekode-tidsseriedatabasen som støtter full SQL og er optimalisert for rask ekstraksjon og komplekse spørringer som støtter full SQL. Det er basert på PostgreSQL og tilbyr det beste fra NoSQL- og relasjonsverdenen for tidsseriedata.
TimescaleDB gjør det mulig for utviklere og organisasjoner å utnytte sine muligheter enda mer: analysere fortiden, forstå nåtiden og forutsi fremtiden. Å samle tidsserier og relasjonsdata på spørringsnivå eliminerer datasiloer og gjør demoer og prototyper enklere å implementere. Kombinasjonen av skalerbarhet og et komplett SQL-grensesnitt gir ansatte mulighet til å stille dataspørsmål. |