Algoritmo inteligente de recuperação de vídeo A recuperação de vídeo depende de algoritmos de vídeo para analisar o conteúdo do vídeo, extrair informações-chave em vídeos, marcar ou processar processos relacionados e formar métodos correspondentes de monitoramento de eventos e alarmes, para que as pessoas possam rapidamente acessar através de várias descrições de atributos. Se a câmera for considerada os olhos de uma pessoa, o sistema inteligente de videovigilância pode ser entendido como o cérebro humano. A tecnologia de vídeo inteligente utiliza a poderosa função computacional do processador para analisar dados massivos na tela de vídeo em alta velocidade e obter as informações de que as pessoas precisam.
Modelo de diferença de quadro
A diferença de quadro pode ser considerada o modelo de fundo mais simples, especificar uma imagem no vídeo como fundo, comparar o quadro atual com o fundo, filtrar as pequenas diferenças conforme necessário, e o resultado é o primeiro plano.
Modelo estatístico de fundo Modelo estatístico de fundo é um método de contar o fundo ao longo de um período de tempo e então calcular suas estatísticas (como média, diferença média, desvio padrão, valor de deriva média, etc.), usando as estatísticas como fundo.
Programe esse modelo de fundo A ideia básica do livro codificado é a seguinte: para a mudança de cada pixel na linha do tempo, estabeleça múltiplas (ou uma) caixas que incluam todas as mudanças recentes; Ao detectar, o pixel atual é usado para comparar com a caixa, e se o pixel atual estiver dentro do alcance de qualquer caixa, ele é o fundo.
Modelo Gaussiano híbrido A modelagem híbrida de fundo Gaussiano é uma das mais bem-sucedidas na modelagem de fundo.
Por que você diz isso? Algoritmos de visão artificial extraem os problemas básicos enfrentados por alvos em movimento: tremor de imagem, interferência de ruído, mudanças de luz, deriva de nuvens, sombras (incluindo sombras de alvos e sombras de objetos fora da área), reflexos dentro da área (como superfície de água, display), movimento lento de alvos em movimento, etc. Então, vamos dar uma olhada: como a modelagem híbrida de fundo Gaussiano resolve esses problemas?
Por meio da modelagem em fundo e extração em primeiro plano, os objetos-alvo no quadro de vídeo são extraídos, mas os extraídos são todos objetos não de fundo, ou seja, misturados, podendo incluir muitas pessoas, carros, animais e outros objetos, e finalmente a busca por imagem para comparar a semelhança entre o objeto e o alvo da busca; aqui é necessário separar esses objetos mistos por meio da detecção e rastreamento de objetos.
Em termos de detecção de objetos, os algoritmos aprendidos incluem o método bayesiano, o filtro de Kalman e o filtro de partículas, e a relação entre eles é a seguinte:
O método bayesiano utiliza informações conhecidas para estabelecer a função densidade de probabilidade do sistema e obter a solução ótima para a estimativa do estado do sistema.
Para problemas lineares de estimação gaussiana, a função densidade de probabilidade esperada ainda é a distribuição gaussiana, e suas características de distribuição podem ser descritas por meios e variâncias, e o filtro de Kalman resolve bem esse tipo de problema de estimação.
Filtro de partículas - Filtro de partículas por amostragem por importância de sequência é um filtro estatístico baseado em analógico, adequado para forte não linearidade e sem restrições gaussianas.
No geral, o efeito da filtragem de partículas é melhor;
Processamento de iluminação: O efeito visual do mesmo objeto sob iluminação diferente é diferente, e os dados correspondentes também são diferentes, então, para melhorar a precisão da análise e da recordação, é necessário realizar tratamento de iluminação no objeto-alvo; Em termos de processamento de luz, o algoritmo mais popular na indústria é o método de decomposição intrínseca de imagens;
Decomposição por autoimagem As informações mais importantes representadas pelas propriedades de cada valor de pixel na imagem obtidas pela câmera são o brilho (sombreamento) e o albedo (refletância). O brilho corresponde à informação de iluminação no ambiente, e o albedo corresponde à informação material do objeto, ou seja, as características de reflexão do objeto para a luz, e o albedo é principalmente a informação de cor do objeto. O problema de resolver a imagem intrínseca é partir da imagem, restaurar as informações de brilho e albedo na cena correspondentes a todos os pixels, e formar respectivamente o eigenmap de brilho e o automapa de albedo
A decomposição intrínseca da imagem pode ser expressa como I(x,y) = L(x,y)R(x,y), onde I(x,y) representa a imagem de entrada, R(x,y) representa a imagem de albedo, e L(x,y) representa a imagem de brilho. Como no campo logarítmico, a multiplicação é convertida em uma adição muito mais fácil, calculamos no campo logarítmico da imagem, com /(X,y) = log(I(x, y)), r0,y) = log(R(x,less)), l(x,y) = log(L(x,y)). Assim, a relação original de multiplicação é transformada em: i(x,y,t) = r(x,y) + l(x,y,t).
|