Išmanusis vaizdo įrašų gavimo algoritmas Vaizdo įrašų gavimas remiasi vaizdo įrašų algoritmais, kad analizuotų vaizdo įrašų turinį, išgautų pagrindinę informaciją vaizdo įrašuose, pažymėtų ar apdorotų susijusius procesus ir suformuotų atitinkamus įvykių ir aliarmų stebėjimo metodus, kad žmonės galėtų greitai gauti įvairius atributų aprašymus. Jei kamera laikoma žmogaus akimis, išmanioji vaizdo stebėjimo sistema gali būti suprantama kaip žmogaus smegenys. Išmanioji vaizdo technologija naudoja galingą procesoriaus skaičiavimo funkciją, kad dideliu greičiu analizuotų didžiulius duomenis vaizdo ekrane ir gautų žmonėms reikalingą informaciją.
Rėmo skirtumo modelis
Galima sakyti, kad kadrų skirtumas yra paprasčiausias fono modelis, nurodykite vaizdą vaizdo įraše kaip foną, palyginkite esamą kadrą su fonu, filtruokite nedidelius skirtumus pagal poreikį ir rezultatas yra priekinis planas.
Foninis statistinis modelis Foninis statistinis modelis yra fono skaičiavimo per tam tikrą laikotarpį metodas, tada apskaičiuojamas jo statistiniai duomenys (pvz., vidurkis, vidutinis skirtumas, standartinis nuokrypis, vidutinė dreifo vertė ir kt.) ir statistiniai duomenys naudojami kaip fonas.
Koduoti šį foninį modelį Pagrindinė užkoduotos knygos idėja yra tokia: norėdami pakeisti kiekvieną laiko juostos pikselį, sukurkite kelis (arba vieną) langelius, kuriuose yra visi naujausi pakeitimai; Aptikus dabartinis pikselis naudojamas palyginimui su langeliu, o jei dabartinis pikselis patenka į bet kurio langelio diapazoną, tai yra fonas.
Hibridinis Gauso modelis Hibridinis Gauso foninis modeliavimas yra vienas iš sėkmingesnių fono modeliavimo.
Kodėl taip sakai? Mašininio matymo algoritmai išskiria pagrindines judančių taikinių problemas: vaizdo drebėjimą, triukšmo trukdžius, šviesos pokyčius, debesų dreifavimą, šešėlius (įskaitant taikinių šešėlius ir objektų šešėlius už teritorijos ribų), atspindžius zonos viduje (pvz., vandens paviršių, ekraną), lėtą judančių taikinių judėjimą ir kt. Taigi pažvelkime, kaip hibridinis Gauso fono modeliavimas išsprendžia šias problemas?
Atliekant foninį modeliavimą ir priekinio plano ištraukimą, vaizdo kadre išgaunami tiksliniai objektai, tačiau išgaunami visi ne fono objektai, tai yra, mišrūs, gali apimti daug žmonių, automobilių, gyvūnų ir kitų objektų, ir galiausiai vaizdo paieška, norint palyginti objekto ir paieškos tikslo panašumą, čia būtina atskirti šiuos mišrius objektus per objektų aptikimą ir sekimą.
Kalbant apie objektų aptikimą, išmokti algoritmai apima Bajeso metodą, Kalmano filtrą ir dalelių filtrą, o jų ryšys yra toks:
Bajeso metodas naudoja žinomą informaciją, kad nustatytų sistemos tikimybės tankio funkciją ir gautų optimalų sprendimą sistemos būklei įvertinti.
Linijinių Gauso vertinimo problemų atveju tikėtina tikimybės tankio funkcija vis dar yra Gauso skirstinys, o jos pasiskirstymo charakteristikas galima apibūdinti vidurkiais ir dispersijomis, o Kalmano filtras gerai išsprendžia tokią vertinimo problemą.
Dalelių filtras - sekos svarbos atrankos dalelių filtras yra analoginis statistinis filtras, tinkantis stipriam netiesiškumui ir be Gauso apribojimų.
Apskritai, dalelių filtravimo poveikis yra geresnis;
Apšvietimo apdorojimas: To paties objekto vizualinis efektas esant skirtingam apšvietimui yra skirtingas, o atitinkami duomenys taip pat skiriasi, todėl norint pagerinti analizės ir atminties tikslumą, būtina atlikti tikslinio objekto apšvietimo apdorojimą; Kalbant apie šviesos apdorojimą, populiaresnis algoritmas pramonėje yra vidinis vaizdo skaidymo metodas;
Atskirų vaizdų skaidymas Svarbiausia informacija, kurią atspindi kiekvieno pikselio vertės savybės fotoaparato gautame vaizde, yra ryškumas (šešėlis) ir albedo (atspindys). Ryškumas atitinka apšvietimo informaciją aplinkoje, o albedo atitinka materialią objekto informaciją, tai yra objekto atspindžio į šviesą charakteristikas, o albedo daugiausia yra objekto spalvinė informacija. Vidinio vaizdo sprendimo problema yra pradėti nuo vaizdo, atkurti ryškumą ir albedo informaciją scenoje, atitinkančią visus pikselius, ir atitinkamai suformuoti ryškumo savižemėlapį ir albedo savižemėlapį
Vidinis vaizdo skaidymas gali būti išreikštas kaip I(x,y) = L(x,y)R(x,y), kur I(x,y) reiškia įvesties vaizdą, R(x,y) reiškia albedo vaizdą, o L(x,y) reiškia ryškumo vaizdą. Kadangi logaritminiame lauke daugyba paverčiama daug lengvesniu sudėjimu, mes apskaičiuojame logaritminiame vaizdo lauke, kai /(X,y) = log(I(x, y)), r0,y) = log(R(x,mažiau)), l(x,y) = log(L(x,y)). Taigi pradinis daugybos ryšys transformuojamas į: i(x,y,t) = r(x,y) + l(x,y,t).
|