Algoritma pengambilan video cerdas Pengambilan video mengandalkan algoritme video untuk menganalisis konten video, mengekstrak informasi penting dalam video, menandai atau memproses proses terkait, dan membentuk metode pemantauan peristiwa dan alarm yang sesuai, sehingga orang dapat dengan cepat mengambil melalui berbagai deskripsi atribut. Jika kamera dianggap sebagai mata seseorang, sistem pengawasan video cerdas dapat dipahami sebagai otak manusia. Teknologi video cerdas menggunakan fungsi komputasi prosesor yang kuat untuk menganalisis data besar di layar video dengan kecepatan tinggi dan mendapatkan informasi yang dibutuhkan orang.
Model perbedaan bingkai
Perbedaan bingkai dapat dikatakan sebagai model latar belakang yang paling sederhana, tentukan gambar dalam video sebagai latar belakang, bandingkan bingkai saat ini dengan latar belakang, filter perbedaan kecil sesuai kebutuhan, dan hasilnya adalah latar depan.
Model statistik latar belakang Model statistik latar belakang adalah metode menghitung latar belakang selama periode waktu tertentu, dan kemudian menghitung statistiknya (seperti rata-rata, perbedaan rata-rata, standar deviasi, nilai penyimpangan rata-rata, dll.), dan menggunakan statistik sebagai latar belakang.
Kode model latar belakang ini Ide dasar dari buku yang dikodekan adalah sebagai berikut: untuk perubahan setiap piksel pada timeline, buat beberapa (atau satu) kotak yang mencakup semua perubahan terbaru; Saat mendeteksi, piksel saat ini digunakan untuk membandingkan dengan kotak, dan jika piksel saat ini berada dalam jangkauan kotak mana pun, itu adalah latar belakang.
Model Gaussian hibrida Pemodelan latar belakang Gaussian hibrida adalah salah satu pemodelan latar belakang yang lebih sukses.
Mengapa Anda mengatakan itu? Algoritme visi mesin mengekstrak masalah dasar yang dihadapi oleh target bergerak: goyangan gambar, gangguan kebisingan, perubahan cahaya, penyimpangan awan, bayangan (termasuk bayangan target dan bayangan objek di luar area), pantulan di dalam area (seperti permukaan air, tampilan), pergerakan lambat target yang bergerak, dll. Jadi mari kita lihat, bagaimana pemodelan latar belakang Gaussian hibrida memecahkan masalah ini?
Melalui pemodelan latar belakang dan ekstraksi latar depan, objek target dalam bingkai video diekstraksi, tetapi yang diekstraksi adalah semua objek non-latar belakang, yaitu, campuran, dapat mencakup banyak orang, mobil, hewan, dan objek lainnya, dan akhirnya pencarian gambar untuk membandingkan kesamaan antara objek dan target pencarian, di sini perlu untuk memisahkan objek campuran ini melalui deteksi dan pelacakan objek.
Dalam hal deteksi objek, algoritma yang dipelajari antara lain metode Bayesian, filter Kalman, dan filter partikel, dan hubungan di antara keduanya adalah sebagai berikut:
Metode Bayesian menggunakan informasi yang diketahui untuk menetapkan fungsi kepadatan probabilitas sistem dan mendapatkan solusi optimal untuk estimasi keadaan sistem.
Untuk masalah estimasi Gaussian linier, fungsi kepadatan probabilitas yang diharapkan masih merupakan distribusi Gaussian, dan karakteristik distribusinya dapat dijelaskan dengan rata-rata dan varians, dan filter Kalman memecahkan masalah estimasi semacam ini dengan baik.
Filter partikel - Filter partikel pengambilan sampel kepentingan urutan adalah filter statistik berbasis analog yang cocok untuk nonlinearitas yang kuat dan tidak ada batasan Gaussian.
Secara keseluruhan, efek penyaringan partikel lebih baik;
Pemrosesan pencahayaan: Efek visual dari objek yang sama di bawah pencahayaan yang berbeda berbeda, dan data yang sesuai juga berbeda, jadi untuk meningkatkan akurasi analisis dan penarikan, perlu dilakukan perawatan pencahayaan pada objek target; Dalam hal pemrosesan cahaya, algoritma yang lebih populer di industri ini adalah metode dekomposisi gambar intrinsik;
Dekomposisi gambar eigen Informasi terpenting yang diwakili oleh sifat-sifat setiap nilai piksel dalam gambar yang diperoleh oleh kamera adalah kecerahan (bayangan) dan albedo (reflektansi). Kecerahan sesuai dengan informasi pencahayaan di lingkungan, dan albedo sesuai dengan informasi material objek, yaitu karakteristik pantulan objek terhadap cahaya, dan albedo terutama merupakan informasi warna objek. Masalah pemecahan gambar intrinsik adalah memulai dari gambar, mengembalikan informasi kecerahan dan albedo dalam pemandangan yang sesuai dengan semua piksel, dan membentuk peta eigenmap kecerahan dan peta eigen albedo masing-masing
Dekomposisi gambar intrinsik dapat dinyatakan sebagai I(x,y) = L(x,y)R(x,y), di mana I(x,y) mewakili gambar input, R(x,y) mewakili gambar albedo, dan L(x,y) mewakili gambar kecerahan. Karena di bidang logaritmik, perkalian diubah menjadi penjumlahan yang jauh lebih mudah, kami menghitung di bidang logaritmik gambar, dengan /(X,y) = log(I(x, y)), r0,y) = log(R(x,kurang)), l(x,y) = log(L(x,y)). Dengan demikian, hubungan perkalian asli diubah menjadi: i(x,y,t) = r(x,y) + l(x,y,t).
|