O Banco de Dados de Séries Temporais (TSDB) é uma breve introdução à sumarização

Pequeno · Publicado em13 segundos atrás

Cenários de aplicação

Um Banco de Dados de Séries Temporais (TSDB) é um banco de dados otimizado para processar fluxos contínuos de dados com carimbo de tempo, como leituras de sensores de IoT, métricas de servidor, transações financeiras. Ele é especialmente projetado para escrita em alta frequência de dados massivos e agregação e consulta rápidas baseadas na dimensão do tempo.

Na era da Internet de Tudo, a quantidade de dados gerada pela Internet Industrial das Coisas é milhares ou até dezenas de milhares de vezes maior do que a da informatização tradicional, e é coleta em tempo real, alta frequência, alta densidade, e o modelo dinâmico de dados pode ser alterado a qualquer momento. Bancos de dados tradicionais estão sobrecarregados no armazenamento, consulta, análise e outras operações de processamento desses dados, e há uma necessidade urgente de um sistema de banco de dados otimizado para dados de séries temporais, ou seja, bancos de dados de séries temporais.

O banco de dados de séries temporais é um banco de dados especializado para armazenar e gerenciar dados de séries temporais, com características de escrever mais e ler menos, distinção entre quente e frio, alta escrita concorrente, ausência de requisitos de transação e escrita contínua de dados massivos.

Características dos dados de séries temporais

Carimbo de data: Cada ponto de dados é marcado com carimbo de tempo, o que é importante para o cálculo e análise dos dados.
Estruturado: Diferente dos dados massivos de rastreadores web, Weibo e WeChat, os dados gerados por dispositivos em rede ou sistemas de monitoramento são estruturados. Esses dados possuem tipos de dados pré-definidos ou comprimentos fixos, como a corrente e a tensão coletadas por medidores inteligentes, que podem ser expressos em um número padrão de ponto flutuante de 4 bytes.
Streaming: Fontes de dados geram dados a uma taxa aproximadamente constante, como fluxos de áudio ou vídeo. Esses fluxos de dados são independentes uns dos outros.
Tráfego suave e previsível: Diferente dos dados de plataformas de comércio eletrônico ou redes sociais, o tráfego de séries temporais é estável ao longo do tempo e pode ser calculado e previsto com base no número de fontes de dados e períodos de amostragem.
Imutabilidade: Os dados de séries temporais geralmente são apenas adicionais, semelhantes aos dados de log, e geralmente não são permitidos nem precisam ser modificados. Existem poucos cenários em que sejam necessárias modificações nos dados brutos coletados.

Classificação

Endereço:O login do hiperlink está visível.Os rankings mais recentes são os seguintes:

base de dados

1、InfluxDB

InfluxDB é um banco de dados distribuído de séries temporais, eventos e métricas de código aberto, escrito na linguagem Go sem dependências externas. Atualmente, o banco de dados é usado principalmente para armazenar grandes quantidades de dados com carimbo de data, como dados de monitoramento DevOps, métricas de APP, dados de sensores de LoT e dados de análise em tempo real.

Como o banco de dados de séries temporais open source de maior ponto, o InfluxDB suporta políticas de armazenamento de dados (RP) e arquivamento de dados (CQ), que podem ser consultados em tempo real, e os dados podem ser encontrados imediatamente após serem indexados quando escritos.

2、Kdb+

Oficialmente conhecido como o banco de dados de séries temporais mais rápido do mundo, o kdb+/q utiliza um banco de dados unificado para processar dados em tempo real e históricos, e possui funções como motor CEP (processamento de eventos complexos), banco de dados em memória e banco de dados em disco. As características do armazenamento colunar tornam extremamente conveniente a realização de análises estatísticas de uma determinada coluna.

Comparado a bancos de dados gerais ou plataformas de big data, o kdb+/q tem maior velocidade e menor custo total de posse, tornando-o ideal para processamento massivo de dados, usado principalmente em análise massiva de dados, negociação de alta frequência, inteligência artificial, Internet das Coisas e outros campos. No setor financeiro, onde a latência é exigente, o kdb+ tem uma vantagem única.

3、Prometheus

Prometheus é uma estrutura de monitoramento e alarme de sistemas de código aberto criada por ex-funcionários do Google que trabalhavam no SoundCloud em 2012 e desenvolvida como um projeto comunitário de código aberto, oficialmente lançada em 2015, e que se juntou oficialmente à Cloud Native Computing Foundation no ano seguinte.

Como uma nova geração de framework de monitoramento, o Prometheus possui um poderoso modelo de dados multidimensional, uma variedade de interfaces gráficas visuais e utiliza o modo pull para coletar dados de séries temporais, que podem ser enviadas para o servidor Prometheus na forma de push gateway.

4、 Grafite

Graphite é um sistema gráfico em tempo real de código aberto que exibe dados para medições de séries temporais. O grafite não coleta as métricas em si, mas funciona como um banco de dados que as recebe pelo backend e depois as consulta, transforma e combina em tempo real.

O Graphite suporta uma interface web embutida que permite aos usuários navegar por dados de medição e gráficos. Ele consiste em múltiplos componentes de back-end e front-end. O componente de back-end é usado para armazenar dados numéricos de séries temporais, enquanto o componente front-end é usado para obter dados de itens métricos e renderizar gráficos com base na situação.

5、TimescaleDB

O TimescaleDB é o único banco de dados de séries temporais de código aberto que suporta SQL completo e é otimizado para extração rápida e consultas complexas que suportam SQL completo. É baseado no PostgreSQL e oferece o melhor dos mundos NoSQL e Relacional para dados de séries temporais.

O TimescaleDB permite que desenvolvedores e organizações aproveitem ainda mais suas capacidades: analisem o passado, entendam o presente e prevejam o futuro. Unificar séries temporais e dados relacionais no nível de consulta elimina silos de dados e facilita a implementação de demonstrações e protótipos. A combinação de escalabilidade e uma interface SQL completa capacita os funcionários a fazer perguntas sobre dados.

O Banco de Dados de Séries Temporais (TSDB) é uma breve introdução à sumarização

Posts Relacionados