Сценарії застосування
База даних часових рядів (TSDB) — це база даних, оптимізована для обробки безперервних потоків даних із часовими мітками, таких як зчитування IoT-сенсорів, метрики серверів, фінансові операції. Він спеціально розроблений для високочастотного запису великих даних та швидкого агрегування та запитів на основі часового розміру.
В епоху Інтернету всього обсяг даних, створених промисловим Інтернетом речей, у тисячі або навіть десятки тисяч разів більший, ніж у традиційній інформатизації, і це збір даних у реальному часі, висока частота, висока щільність, а динамічна модель даних може змінюватися в будь-який момент. Традиційні бази даних перевантажені у зберіганні, запитах, аналізі та інших операціях обробки цих даних, і існує нагальна потреба в системі даних, оптимізованій для даних часових рядів, тобто баз даних часових рядів.
База даних часових рядів — це спеціалізована база даних для зберігання та управління даними часових рядів, з характеристиками запису більшої кількості і меншого читання, розрізнення гарячого і холодного, високого одночасного запису, відсутності вимог до транзакцій і безперервного запису великих даних.
Характеристики даних часових рядів
Часова позначка: Кожна точка даних має часову мітку, що важливо для розрахунку та аналізу даних. Структуровано: На відміну від величезних даних від веб-краулерів, Weibo та WeChat, дані, які генерують мережеві пристрої або системи моніторингу, є структурованими. Ці дані мають заздалегідь визначені типи даних або фіксовану довжину, такі як струм і напруга, що збираються розумними лічильниками, які можна виразити у стандартному числі з плаваючою комою — 4 байти. Потоковий поток: Джерела даних генерують дані приблизно з постійною швидкістю, наприклад, аудіо або відеопотоки. Ці потоки даних є незалежними один від одного. Плавний і передбачуваний трафік: На відміну від даних з платформ електронної комерції чи соціальних мереж, трафік даних часових рядів стабільний з часом і може бути розрахований та прогнозований на основі кількості джерел даних і періодів вибірки. Незмінність: Дані часових рядів зазвичай є лише доданими, подібно до логарифмічних даних, і зазвичай не дозволені та не потребують змін. Існує небагато сценаріїв, де потрібні зміни до зібраних сирих даних.
Рейтинг
Адреса:Вхід за гіперпосиланням видно.Останні рейтинги такі:
база даних
1、InfluxDB
InfluxDB — це відкрита розподілена база даних часових рядів, подій та метрик, написана мовою Go без зовнішніх залежностей. База даних зараз переважно використовується для зберігання великих обсягів даних з часовими позначеннями, таких як дані моніторингу DevOps, метрики APP, дані сенсорів loT та аналітичні дані в реальному часі.
Як найвищий за рейтингом відкрита база даних часових рядів, InfluxDB підтримує політику зберігання даних (RP) та архівування даних (CQ), які можна запитувати в реальному часі, а дані можна знайти одразу після індексації після запису.
2、Kdb+
Офіційно відома як найшвидша у світі база даних часових рядів, kdb+/q використовує уніфіковану базу даних для обробки даних у реальному часі та історичних даних, а також має такі функції, як двигун CEP (обробка складних подій), база даних у пам'яті та база даних на диску. Характеристики колонного зберігання роблять статистичний аналіз певного стовпця надзвичайно зручним.
Порівняно з загальними базами даних або платформами великих даних, kdb+/q має вищу швидкість і нижчу загальну вартість володіння, що робить його ідеальним для масштабної обробки даних, переважно для аналізу масивних даних, високочастотної торгівлі, штучного інтелекту, Інтернету речей та інших сферах. У фінансовому секторі, де затримка є вимогливою, kdb+ має унікальну перевагу.
3、Prometheus
Prometheus — це відкритий фреймворк моніторингу систем і сигналізації, створений колишніми співробітниками Google, які працювали в SoundCloud у 2012 році, і розроблений як спільнотний проєкт відкритого коду, офіційно випущений у 2015 році та офіційно приєднаний до Cloud Native Computing Foundation наступного року.
Як нове покоління моніторингової системи, Prometheus має потужну багатовимірну модель даних, різноманітні графічні інтерфейси та використовує режим pull для збору даних часових рядів, які можна передавати на сервер Prometheus у вигляді push-шлюзу.
4、 Графіт
Graphite — це відкрита система графіків у реальному часі, яка відображає дані для вимірювань часових рядів. Graphite не збирає самі метрики, а діє як база даних, яка отримує їх через бекенд, а потім робить запити, трансформує та об'єднує їх у реальному часі.
Graphite підтримує вбудований веб-інтерфейс, який дозволяє користувачам переглядати дані вимірювання та графіки. Він складається з кількох бекендних і фронтенд-компонентів. Бекенд-компонент використовується для зберігання числових часових рядів, тоді як фронтенд-компонент — для отримання метричних елементів і рендерингових діаграм залежно від ситуації.
5、TimescaleDB
TimescaleDB — єдина відкрита база даних часових рядів, яка підтримує повний SQL і оптимізована для швидкого вилучення та складних запитів, що підтримують повний SQL. Він базується на PostgreSQL і пропонує найкраще з NoSQL та реляційних світів для даних часових рядів.
TimescaleDB дає змогу розробникам і організаціям ще більше використовувати його можливості: аналізувати минуле, розуміти сьогодення та прогнозувати майбутнє. Об'єднання часових рядів і реляційних даних на рівні запитів усуває ізольовані дані та робить реалізацію демонстрацій і прототипів. Поєднання масштабованості та повного SQL-інтерфейсу дає працівникам змогу ставити запитання щодо даних. |