|
|
Opublikowano 23.05.2019 18:54:43
|
|
|

Inteligentny algorytm wyszukiwania wideo Wyszukiwanie wideo opiera się na algorytmach wideo do analizy treści wideo, wyodrębniania kluczowych informacji z filmów, oznaczania lub przetwarzania procesów związanych z nimi oraz tworzenia odpowiadających metod monitorowania zdarzeń i alarmów, dzięki czemu ludzie mogą szybko uzyskać informacje za pomocą różnych opisów atrybutów. Jeśli kamera jest traktowana jako oczy człowieka, inteligentny system monitoringu wideo można rozumieć jako ludzki mózg. Technologia inteligentnego wideo wykorzystuje potężną funkcję obliczeniową procesora do analizy ogromnych ilości danych na ekranie wideo z dużą prędkością i uzyskania potrzebnych informacji.
Model różnicy ramek
Różnica klatek można nazwać najprostszym modelem tła: określ obraz w wideo jako tło, porównaj aktualną klatkę z tłem, filtruj drobne różnice w razie potrzeby i otrzymujesz pierwszy plan.
Tło statystyczne Model statystyczny tła to metoda liczenia tła w określonym czasie, a następnie obliczania jego statystyk (takich jak średnia, różnica średnia, odchylenie standardowe, wartość dryfu średniej itp.) i wykorzystywanie tych statystyk jako tła.
Zakoduj ten model tła Podstawowa idea zakodowanej książki jest następująca: dla zmiany każdego piksela na osi czasu należy ustalić wiele (lub jeden) pola, które zawierają wszystkie ostatnie zmiany; Podczas wykrywania bieżący piksel jest używany do porównania z pudełkiem, a jeśli aktualny piksel mieści się w zakresie dowolnego pudełka, to jest to tło.
Hybrydowy model Gaussa Hybrydowe modelowanie tła Gaussa jest jednym z bardziej udanych modelowania tła.
Dlaczego tak mówisz? Algorytmy widzenia maszynowego wyodrębniają podstawowe problemy poruszające się cele: drżenie obrazu, zakłócenia szumowe, zmiany światła, dryfowanie chmur, cienie (w tym cienie celów i obiektów poza obszarem), odbicia wewnątrz obszaru (takie jak powierzchnia wody, wyświetlacz), powolny ruch ruchomych celów itp. Przyjrzyjmy się więc, jak hybrydowe modelowanie tła Gaussa rozwiązuje te problemy?
Dzięki modelowaniu tła i ekstrakcji pierwszego planu obiekty docelowe w klatce wideo są wyodrębniane, ale wyodrębniane są wyłącznie obiekty niebędące tłem, czyli mieszane, mogą obejmować wiele osób, samochodów, zwierząt i innych obiektów, a na końcu przeszukiwanie obrazu w celu porównania podobieństwa między obiektem a celem wyszukiwania jest tutaj konieczne oddzielenie tych zmieszanych obiektów poprzez wykrywanie i śledzenie obiektów.
W zakresie wykrywania obiektów nauczone algorytmy to metoda bayesowska, filtr Kalmana oraz filtr cząstek, a relacja między nimi wygląda następująco:
Metoda bayesowska wykorzystuje znane informacje do ustalenia funkcji gęstości prawdopodobieństwa układu i uzyskania optymalnego rozwiązania dla estymacji stanu układu.
W przypadku liniowych problemów estymacji Gaussa oczekiwana funkcja gęstości prawdopodobieństwa nadal jest rozkładem gaussowskim, a jej charakterystyki rozkładu można opisać za pomocą średnich i wariancji, a filtr Kalmana dobrze rozwiązuje tego typu problem estymacji.
Filtr cząstek – Filtr cząstek o znaczeniu sekwencji to analogowy filtr statystyczny odpowiedni do silnej nieliniowości i bez ograniczeń Gaussa.
Ogólnie rzecz biorąc, efekt filtrowania cząstek jest lepszy;
Przetwarzanie oświetlenia: Efekt wizualny tego samego obiektu pod różnym oświetleniem jest inny, a odpowiadające mu dane również są inne, więc aby poprawić dokładność analizy i przypomnienia, konieczne jest wykonanie obróbki oświetleniowej na docelowym obiekcie; W kontekście przetwarzania światła popularniejszym algorytmem w branży jest metoda dekompozycji obrazu wewnętrznego;
Dekompozycja obrazu własnego Najważniejsze informacje reprezentowane przez właściwości każdego piksela na obrazie uzyskanym przez aparat to jasność (cieniowanie) oraz albedo (odbicie). Jasność odpowiada informacjom o oświetleniu w otoczeniu, a albedo odpowiada materiałowej informacji obiektu, czyli charakterystykom odbicia obiektu względem światła, a albedo to głównie informacje o kolorze obiektu. Problemem rozwiązania obrazu wewnętrznego jest rozpoczęcie od obrazu, przywrócenie jasności i informacji o albedo w scenie odpowiadającej wszystkim pikselom oraz utworzenie odpowiednio mapy własnej jasności i albedo
Rozkład obrazu wewnętrznego można wyrazić jako I(x,y) = L(x,y)R(x,y), gdzie I(x,y) oznacza obraz wejściowy, R(x,y) obraz albeda, a L(x,y) obraz jasności. Ponieważ w polu logarytmicznym mnożenie jest przekształcane w znacznie łatwiejsze dodawanie, obliczamy w polu logarytmicznym obrazu, gdzie /(X,y) = log(I(x, y)), r0,y) = log(R(x,less)), l(x,y) = log(L(x,y)). W ten sposób pierwotna relacja mnożenia jest przekształcana na: i(x,y,t) = r(x,y) + l(x,y,t).
|
Poprzedni:Typescript TimeDateFormat ciągów tekstówNastępny:asp.net tutorial dotyczący frameworka Hangfire w tle zadania
|