이 글은 기계 번역의 미러 문서이며, 원본 기사로 바로 이동하려면 여기를 클릭해 주세요.

보기: 11372|회답: 10

비디오 데이터 알고리즘이 노트를 공유합니다

[링크 복사]
게시됨 2019. 5. 23. 오후 6:54:43 | | |

지능형 비디오 검색 알고리즘
비디오 검색은 비디오 콘텐츠를 분석하고, 주요 정보를 추출하며, 관련 프로세스를 표시하거나 처리하고, 대응하는 이벤트와 경보 모니터링 방식을 형성하는 데 의존합니다. 이를 통해 다양한 속성 설명을 통해 빠르게 검색할 수 있습니다. 카메라를 사람의 눈으로 본다면, 지능형 비디오 감시 시스템은 인간의 뇌로 이해할 수 있습니다. 지능형 비디오 기술은 프로세서의 강력한 컴퓨팅 기능을 이용해 비디오 화면의 방대한 데이터를 고속으로 분석하고 사람들이 필요로 하는 정보를 얻습니다.

프레임 차이 모델

      프레임 차이는 가장 단순한 배경 모델이라고 할 수 있습니다. 비디오 내 이미지를 배경으로 지정하고, 현재 프레임과 배경을 비교하며, 필요에 따라 작은 차이를 필터링하여 결과가 전경이 됩니다.

배경 통계 모델
   배경 통계 모델은 일정 기간 동안 배경을 세고, 그 통계량(예: 평균, 평균 차이, 표준편차, 평균 드리프트 값 등)을 계산한 후 통계를 배경으로 사용하는 방법입니다.

이 배경 모델을 코딩합니다
인코딩된 책의 기본 아이디어는 다음과 같습니다: 타임라인의 각 픽셀 변화에 대해 최근 변경 사항을 모두 포함하는 다수(또는 하나) 상자를 만듭니다; 감지 시 현재 픽셀을 사용해 박스와 비교하며, 현재 픽셀이 어떤 박스의 범위 내에 있으면 그것이 배경입니다.

하이브리드 가우시안 모델
하이브리드 가우시안 배경 모델링은 비교적 성공적인 배경 모델링 중 하나입니다.

왜 그렇게 말해요? 머신 비전 알고리즘은 움직이는 목표물이 직면하는 기본 문제들을 추출합니다: 이미지 흔들림, 노이즈 간섭, 빛 변화, 구름 이동, 그림자(목표물 그림자 및 영역 밖의 물체 그림자 포함), 영역 내 반사(예: 수면, 디스플레이), 움직이는 목표물의 느린 움직임 등. 그렇다면 하이브리드 가우시안 배경 모델링이 이러한 문제들을 어떻게 해결하는지 살펴보겠습니다.

배경 모델링과 전경 추출을 통해 비디오 프레임 내 대상 객체가 추출되지만, 추출되는 객체는 모두 비배경 객체, 즉 혼합된 객체이며, 많은 사람, 자동차, 동물 및 기타 객체를 포함할 수 있습니다. 마지막으로 이미지 검색을 통해 객체와 검색 대상 간의 유사성을 비교할 수 있습니다. 여기서는 객체 탐지와 추적을 통해 이 혼합된 객체들을 분리하는 것이 필요합니다.

객체 탐지 측면에서 학습되는 알고리즘에는 베이지안 방법, 칼만 필터, 입자 필터가 포함되며, 이들 간의 관계는 다음과 같습니다:

베이지안 방법은 알려진 정보를 사용하여 시스템의 확률 밀도 함수를 확립하고 시스템 상태 추정의 최적 해를 얻습니다.

선형 가우시안 추정 문제에서는 기대 확률 밀도 함수가 여전히 가우시안 분포이며, 그 분포 특성은 평균과 분산으로 설명할 수 있고, 칼만 필터는 이러한 추정 문제를 잘 해결한다.

입자 필터 - 시퀀스 중요도 샘플링 입자 필터는 강한 비선형성과 가우시안 제약 없이 적합한 아날로그 기반 통계 필터입니다.

전반적으로 입자 필터링의 효과가 더 좋으며;

조명 처리: 동일한 물체가 서로 다른 조명 아래에서 나타나는 시각 효과가 다르고, 해당 데이터도 다르므로, 분석 및 기억의 정확성을 높이기 위해서는 대상 객체에 대한 조명 처리가 필요합니다; 광 처리 측면에서 업계에서 더 널리 사용되는 알고리즘은 내재 이미지 분해법(intrinic image decomposition)입니다;

고유이미지 분해
카메라가 얻은 이미지의 각 픽셀 값의 특성으로 나타내는 가장 중요한 정보는 밝기(음영)와 반사율(albedo)입니다. 밝기는 환경 내 조명 정보에 해당하고, 알베도는 물체의 물질 정보, 즉 물체가 빛에 반사하는 특성에 해당하며, 알베도는 주로 물체의 색상 정보를 나타냅니다. 내재 이미지를 푸는 문제는 이미지에서 시작하여 장면에서 모든 픽셀에 대응하는 밝기와 알베도 정보를 복원하고, 각각 밝기 고유지도와 알베도 고유 지도를 만드는 것입니다

내재 이미지 분해는 I(x,y) = L(x,y)R(x,y)로 표현할 수 있으며, 여기서 I(x,y)는 입력 이미지, R(x,y)는 알베도 이미지, L(x,y)는 밝기 이미지를 나타냅니다. 로그필드에서는 곱셈이 훨씬 쉽게 덧셈으로 변환되기 때문에, 이미지의 로그필드에서 /(X,y) = log(I(x, y)), r0,y) = log(R(x,less)), l(x,y) = log(L(x,y)를 계산합니다. 따라서 원래의 곱셈 관계는 i(x,y,t) = r(x,y) + l(x,y,t)로 변환됩니다.






이전의:Typescript TimeDate formats strings
다음:asp.net 배경 작업 행파이어 프레임워크 튜토리얼
 집주인| 게시됨 2019. 6. 3. 오전 9:17:36 |
희소성 알고리즘 엔지니어 이력서
 집주인| 게시됨 2019. 6. 6. 오전 9:04:23 |
 집주인| 게시됨 2019. 6. 11. 오전 10:11:14 |
아직도 친구가 너무 적어
 집주인| 게시됨 2019. 6. 14. 오전 8:54:14 |
미리 좋은 주말 보내세요.
 집주인| 게시됨 2019. 6. 18. 오전 9:45:36 |

중국 여자 축구팀은 잘한다.서둘러
 집주인| 게시됨 2019. 7. 29. 오후 3:39:29 |
친구를 추가하는 비디오 알고리즘을 원하는 친구가 있나요?
 집주인| 게시됨 2019. 7. 31. 오후 3:11:13 |
Verilog(RTL) 설계 코드에 대한 어느 정도의 이해, 행렬 가속, FFT/DFT 등 수학적 연산에 대한 깊은 이해, 또는 전통적인 openCV 라이브러리 연산 최적화에 대한 깊은 이해가 있는 사람을 원합니다. 소프트웨어 전용자는 임베디드 시스템에서 하드웨어 가속을 달성할 수 없기 때문에 할 수 없고, 순수 칩 설계자들도 복잡한 수학을 단순한 곱셈과 덧셈으로 바꿀 수 있는 능력을 이해하지 못해 할 수 없습니다
 집주인| 게시됨 2019. 8. 1. 오후 3:33:34 |
 집주인| 게시됨 2019. 9. 12. 오후 3:26:59 |
면책 조항:
Code Farmer Network에서 발행하는 모든 소프트웨어, 프로그래밍 자료 또는 기사는 학습 및 연구 목적으로만 사용됩니다; 위 내용은 상업적 또는 불법적인 목적으로 사용되지 않으며, 그렇지 않으면 모든 책임이 사용자에게 부담됩니다. 이 사이트의 정보는 인터넷에서 가져온 것이며, 저작권 분쟁은 이 사이트와는 관련이 없습니다. 위 내용은 다운로드 후 24시간 이내에 컴퓨터에서 완전히 삭제해야 합니다. 프로그램이 마음에 드신다면, 진짜 소프트웨어를 지원하고, 등록을 구매하며, 더 나은 진짜 서비스를 받아주세요. 침해가 있을 경우 이메일로 연락해 주시기 바랍니다.

Mail To:help@itsvse.com