Il Database delle Serie Temporali (TSDB) è una breve introduzione alla sintesi

Piccola feccia · Pubblicato su13 secondi fa

Scenari applicabili

Un Database delle Serie Temporali (TSDB) è un database ottimizzato per l'elaborazione di flussi di dati continui con timestamp come letture di sensori IoT, metriche server e transazioni finanziarie. È progettato appositamente per la scrittura ad alta frequenza di dati massici e per l'aggregazione e la query rapida basate sulla dimensione temporale.

Nell'era dell'Internet di Tutto, la quantità di dati generati dall'Internet delle Cose Industriale è migliaia o addirittura decine di migliaia di volte superiore a quella dell'informatizzazione tradizionale, ed è raccolta in tempo reale, ad alta frequenza, alta densità, e il modello dinamico dei dati può cambiare in qualsiasi momento. I database tradizionali sono sovraccarichi nella memorizzazione, interrogazione, analisi e altre operazioni di elaborazione di questi dati, e vi è un'urgente necessità di un sistema di database ottimizzato per i dati delle serie temporali, cioè i database delle serie temporali.

Il database delle serie temporali è un database specializzato per memorizzare e gestire i dati delle serie temporali, con caratteristiche di scrivere più e leggere meno, distinzione tra caldo e freddo, alta scrittura concorrente, assenza di requisiti di transazione e scrittura continua di dati di grandi dimensioni.

Caratteristiche dei dati delle serie temporali

Timestamp: Ogni punto dati è datato con timestamp, il che è importante per il calcolo e l'analisi dei dati.
Strutturato: A differenza dei dati massicci provenienti da web crawler, Weibo e WeChat, i dati generati da dispositivi in rete o sistemi di monitoraggio sono strutturati. Questi dati hanno tipi di dati predefiniti o lunghezze fisse, come la corrente e la tensione raccolte dai contatori intelligenti, che possono essere espressi in un numero standard in virgola mobile di 4 byte.
Streaming: Le fonti di dati generano dati a una velocità approssimativamente costante, come flussi audio o video. Questi flussi di dati sono indipendenti tra loro.
Traffico fluido e prevedibile: A differenza dei dati provenienti da piattaforme di e-commerce o siti di social media, il traffico dei dati delle serie temporali è stabile nel tempo e può essere calcolato e previsto in base al numero di fonti di dati e ai periodi di campionamento.
Immutabilità: I dati delle serie temporali sono generalmente solo appendi, simili ai dati di log, e generalmente non sono permessi e non necessitano di modifica. Ci sono pochi scenari in cui siano necessarie modifiche ai dati grezzi raccolti.

Classifica

Indirizzo:Il login del link ipertestuale è visibile.Le ultime classifiche sono le seguenti:

banca dati

1、InfluxDB

InfluxDB è un database distribuito open source di serie temporali, eventi e metriche scritto nel linguaggio Go senza dipendenze esterne. Il database è ora utilizzato principalmente per memorizzare grandi quantità di dati timestampati come dati di monitoraggio DevOps, metriche APP, dati sensori di loT e dati analitici in tempo reale.

Come database open source di serie temporali con il più alto valore, InfluxDB supporta la politica di archiviazione dati (RP) e l'archiviazione dati (CQ), che possono essere interrogate in tempo reale, e i dati possono essere trovati immediatamente dopo essere stati indicizzati al momento della scrittura.

2、Kdb+

Ufficialmente noto come il database di serie temporali più veloce al mondo, kdb+/q utilizza un database unificato per elaborare dati in tempo reale e storici, e dispone di funzioni come motore CEP (complex event processing), database in memoria e database su disco. Le caratteristiche dello stoccaggio a colonna rendono estremamente comodo l'esecuzione di un'analisi statistica di una determinata colonna.

Rispetto ai database generali o alle piattaforme big data, kdb+/q ha una velocità superiore e un costo totale di proprietà inferiore, rendendolo ideale per l'elaborazione massiccia di dati, utilizzata principalmente nell'analisi di dati di massa, nel trading ad alta frequenza, nell'intelligenza artificiale, nell'Internet delle Cose e in altri settori. Nel settore finanziario, dove la latenza è impegnativa, il kdb+ ha un vantaggio unico.

3、Prometheus

Prometheus è un framework open-source di monitoraggio e allarmi creato da ex dipendenti Google che lavoravano in SoundCloud nel 2012 e sviluppato come progetto open source comunitario, rilasciato ufficialmente nel 2015, e che si è ufficialmente unito alla Cloud Native Computing Foundation l'anno successivo.

Come nuovo sistema di monitoraggio di nuova generazione, Prometheus dispone di un potente modello dati multidimensionale, di una varietà di interfacce grafiche visive e utilizza la modalità pull per raccogliere dati sulle serie temporali, che possono essere inviati al server Prometheus sotto forma di push gateway.

4、 Grafite

Graphite è un sistema grafico open-source in tempo reale che visualizza dati per le misurazioni di serie temporali. Graphite non raccoglie le metriche in sé, ma agisce come un database che le riceve tramite il proprio backend e poi le interroga, trasforma e combina in tempo reale.

Graphite supporta un'interfaccia web integrata che permette agli utenti di sfogliare dati di misurazione e grafici. È composto da molteplici componenti back-end e front-end. Il componente back-end viene utilizzato per memorizzare dati numerici di serie temporali, mentre il componente front-end viene utilizzato per ottenere dati metrici e renderizzare grafici in base alla situazione.

5、TimescaleDB

TimescaleDB è l'unico database open source di serie temporali che supporta il SQL completo ed è ottimizzato per estrazioni rapide e query complesse che supportano SQL completo. Si basa su PostgreSQL e offre il meglio dei mondi NoSQL e Relazionali per i dati di serie temporali.

TimescaleDB consente a sviluppatori e organizzazioni di sfruttare ancora di più le sue capacità: analizzare il passato, comprendere il presente e prevedere il futuro. Unificare i dati di serie temporali e relazionali a livello di query elimina i silos dei dati e rende più facili l'implementazione di demo e prototipi. La combinazione di scalabilità e interfaccia SQL completa permette ai dipendenti di porre domande sui dati.

Il Database delle Serie Temporali (TSDB) è una breve introduzione alla sintesi

Post correlati