Scénáře použití
Databáze časových řad (TSDB) je databáze optimalizovaná pro zpracování časově označených kontinuálních datových toků, jako jsou měření ze senzorů IoT, serverové metriky, finanční transakce. Je speciálně navržen pro vysokofrekvenční zápis obrovských dat a rychlou agregaci a dotazování podle časové dimenze.
V éře Internetu všeho je množství dat generovaných průmyslovým internetem věcí tisíce či dokonce desetitisíckrát větší než u tradiční informatizace, a jde o sběr v reálném čase, vysokou frekvenci, vysokou hustotu a dynamický datový model je kdykoli proměnlivý. Tradiční databáze jsou velmi přetížené při ukládání dat, dotazování, analýze a dalších procesech zpracování těchto dat, a proto je naléhavě potřeba databázového systému optimalizovaného pro data časových řad, tedy pro databáze časových řad.
Databáze časových řad je specializovaná databáze pro ukládání a správu dat časových řad, která zahrnuje více zápisu a méně čtení, rozlišení horkého a studeného psaní, vysoký souběžný zápis, žádné požadavky na transakce a kontinuální zápis obrovských dat.
Charakteristiky časových řad dat
Časové razítko: Každý datový bod je časově označen, což je důležité pro výpočet a analýzu dat. Strukturované: Na rozdíl od rozsáhlých dat z webových crawlerů, Weibo a WeChatu jsou data generovaná síťovými zařízeními nebo monitorovacími systémy strukturovaná. Tato data mají předdefinované datové typy nebo pevné délky, například proud a napětí shromážděné chytrými měřiči, které lze vyjádřit standardním číslem s plovoucí desetinnou čárkou 4 bajty. Streamování: Datové zdroje generují data přibližně konstantní rychlostí, například audio nebo video streamy. Tyto datové toky jsou na sobě nezávislé. Plynulá a předvídatelná návštěvnost: Na rozdíl od dat z e-commerce platforem nebo sociálních sítí je provoz časových řad dat stabilní v čase a lze jej vypočítat a předpovědět na základě počtu zdrojů dat a vzorkovacích období. Neměnnost: Data časových řad jsou obvykle pouze připojitelná, podobně jako log, a obecně nejsou povolena a není třeba je upravovat. Existuje jen málo situací, kdy je potřeba upravovat surová data.
Pořadí
Adresa:Přihlášení k hypertextovému odkazu je viditelné.Nejnovější žebříčky jsou následující:
databáze
1、InfluxDB
InfluxDB je open-source distribuovaná databáze časových řad, událostí a metrik napsaná v jazyce Go bez externích závislostí. Databáze se nyní primárně používá k ukládání velkého množství dat s časovými razítky, jako jsou monitorovací data DevOps, metriky APP, data ze senzorů loT a data z analýzy v reálném čase.
Jako nejvýše hodnocená open source databáze časových řad podporuje InfluxDB politiku ukládání dat (RP) a archivaci dat (CQ), které lze dotazovat v reálném čase a data lze ihned po indexování při zápisu najít.
2、Kdb+
Oficiálně známá jako nejrychlejší databáze časových řad na světě, kdb+/q využívá sjednocenou databázi pro zpracování dat v reálném čase i historických dat a má funkce jako CEP (komplexní zpracování událostí), databáze v paměti a disková databáze. Charakteristiky sloupcového ukládání činí velmi pohodlným provádění statistické analýzy určitého sloupce.
Ve srovnání s obecnými databázemi nebo platformami pro velká data má kdb+/q rychlejší rychlost a nižší celkové náklady na vlastnictví, což z něj činí ideální pro masivní zpracování dat, zejména pro analýzu masivních dat, vysokofrekvenční obchodování, umělou inteligenci, Internet věcí a další obory. Ve finančním sektoru, kde je latence náročná, má kdb+ jedinečnou výhodu.
3、Prométheus
Prometheus je open-source rámec pro monitorování systémů a alarmy, který vytvořili bývalí zaměstnanci Googlu pracující na SoundCloudu v roce 2012 a byl vyvinut jako komunitní open source projekt, oficiálně vydaný v roce 2015 a o rok později oficiálně připojen k Cloud Native Computing Foundation.
Jako nová generace monitorovacího rámce má Prometheus výkonný vícerozměrný datový model, řadu vizuálních grafických rozhraní a využívá pull mode ke sběru časových řad dat, která lze na server Prometheus posílat formou push gateway.
4、 Grafit
Graphite je open-source systém pro grafy v reálném čase, který zobrazuje data pro měření časových řad. Graphite metriky sám nesbírá, ale funguje jako databáze, která je přijímá přes svůj backend a poté je v reálném čase dotazuje, transformuje a kombinuje.
Graphite podporuje vestavěné webové rozhraní, které uživatelům umožňuje prohlížet měřicí data a grafy. Skládá se z více back-end a front-end komponent. Back-end komponenta slouží k ukládání číselných časových řad, zatímco front-end komponenta slouží k získávání metrických dat o položkách a vykreslování grafů podle situace.
5、TimescaleDB
TimescaleDB je jediná open-source databáze časových řad, která podporuje plný SQL a je optimalizována pro rychlou extrakci a složité dotazy podporující plné SQL. Je založen na PostgreSQL a nabízí to nejlepší ze světa NoSQL a relačních pro data časových řad.
TimescaleDB umožňuje vývojářům a organizacím ještě více využívat jeho schopnosti: analyzovat minulost, rozumět přítomnosti a předpovídat budoucnost. Sjednocení časových řad a relačních dat na úrovni dotazu eliminuje datové silo a usnadňuje implementaci ukázek a prototypů. Kombinace škálovatelnosti a plného SQL rozhraní umožňuje zaměstnancům klást otázky týkající se dat. |