|
|
Publié sur 23/05/2019 18:54:43
|
|
|

Algorithme intelligent de récupération vidéo La récupération vidéo repose sur des algorithmes vidéo pour analyser le contenu vidéo, extraire les informations clés dans les vidéos, marquer ou traiter les processus liés, et former des méthodes correspondantes de surveillance des événements et des alarmes, afin que les utilisateurs puissent rapidement accéder à diverses descriptions d’attributs. Si la caméra est considérée comme les yeux d’une personne, le système intelligent de vidéosurveillance peut être compris comme le cerveau humain. La technologie vidéo intelligente utilise la puissante fonction de calcul du processeur pour analyser à grande vitesse les données massives de l’écran vidéo et obtenir les informations dont les gens ont besoin.
Modèle de différence de trame
La différence d’image peut être considérée comme le modèle d’arrière-plan le plus simple : spécifier une image dans la vidéo comme arrière-plan, comparer l’image actuelle avec l’arrière-plan, filtrer les petites différences selon les besoins, et le résultat est le premier plan.
Modèle statistique de fond Le modèle statistique de fond est une méthode consistant à compter le fond sur une période de temps, puis à calculer ses statistiques (telles que la moyenne, la différence moyenne, l’écart-type, la valeur de dérive moyenne, etc.), et à utiliser ces statistiques comme arrière-plan.
Codez ce modèle de fond L’idée de base du livre encodé est la suivante : pour le changement de chaque pixel de la timeline, établir plusieurs (ou une) cases incluant toutes les modifications récentes ; Lors de la détection, le pixel actuel sert à comparer avec la boîte, et si le pixel actuel se situe dans la plage d’une boîte, c’est l’arrière-plan.
Modèle gaussien hybride La modélisation hybride gaussienne du fond est l’une des modélisations les plus réussies.
Pourquoi tu dis ça? Les algorithmes de vision artificielle extraient les problèmes fondamentaux rencontrés par les cibles en mouvement : tremblement d’image, interférences sonores, changements de lumière, dérive des nuages, ombres (y compris les ombres de cibles et ombres d’objets à l’extérieur de la zone), réflexions à l’intérieur de la zone (comme la surface de l’eau, l’affichage), le mouvement lent des cibles en mouvement, etc. Alors, regardons comment la modélisation hybride gaussienne du fond résout-elle ces problèmes ?
Par modélisation de fond et extraction du premier plan, les objets cibles dans la trame vidéo sont extraits, mais les objets extraits sont tous des objets non en arrière-plan, c’est-à-dire mélangés, pouvant inclure de nombreuses personnes, voitures, animaux et autres objets, et enfin la recherche d’image consiste à comparer la similarité entre l’objet et la cible de recherche ; ici, il est nécessaire de séparer ces objets mélangés par détection et suivi d’objets.
En ce qui concerne la détection d’objets, les algorithmes appris incluent la méthode bayésienne, le filtre de Kalman et le filtre à particules, et la relation entre eux est la suivante :
La méthode bayésienne utilise des informations connues pour établir la fonction de densité de probabilité du système et obtenir la solution optimale pour l’estimation de l’état du système.
Pour les problèmes d’estimation linéaire gaussienne, la fonction de densité de probabilité attendue reste une distribution gaussienne, et ses caractéristiques de distribution peuvent être décrites par des moyennes et variances, et le filtre de Kalman résout bien ce type de problème d’estimation.
Filtre à particules - Le filtre à échantillonnage par importance de séquence est un filtre statistique basé sur l’analogie, adapté à une forte non linéarité et sans contraintes gaussiennes.
Dans l’ensemble, l’effet du filtrage des particules est meilleur ;
Traitement de l’éclairage : L’effet visuel du même objet sous un éclairage différent est différent, et les données correspondantes sont également différentes, donc pour améliorer la précision de l’analyse et du rappel, il est nécessaire de traiter l’éclairage sur l’objet cible ; En termes de traitement de la lumière, l’algorithme le plus populaire dans l’industrie est la méthode de décomposition intrinsèque d’image ;
Décomposition par image propre Les informations les plus importantes représentées par les propriétés de chaque valeur de pixel dans l’image obtenues par l’appareil sont la luminosité (ombrage) et l’albédo (réflectance). La luminosité correspond à l’information d’éclairage dans l’environnement, et l’albédo correspond à l’information matérielle de l’objet, c’est-à-dire les caractéristiques de réflexion de l’objet par rapport à la lumière, et l’albédo est principalement l’information de couleur de l’objet. Le problème pour résoudre l’image intrinsèque consiste à partir de l’image, à restaurer les informations de luminosité et d’albédo dans la scène correspondant à tous les pixels, puis à former respectivement la carte propre de luminosité et la carte propre d’albédo
La décomposition intrinsèque de l’image peut s’exprimer comme I(x,y) = L(x,y)R(x,y), où I(x,y) représente l’image d’entrée, R(x,y) représente l’image albédo, et L(x,y) représente l’image de luminosité. Parce que dans le corps logarithmique, la multiplication est convertie en une addition beaucoup plus simple, on calcule dans le champ logarithmique de l’image, avec /(X,y) = log(I(x, y)), r0,y) = log(R(x,less)), l(x,y) = log(L(x,y)). Ainsi, la relation de multiplication originale se transforme en : i(x,y,t) = r(x,y) + l(x,y,t).
|
Précédent:Typescript TimeDateDate formats chaînesProchain:asp.net tutoriel du framework Hangfire pour les tâches en arrière-plan
|