基于深度學(xué)習(xí)的前沿視頻異常檢測方法綜述

打開文本圖片集
摘 要:視頻異常事件檢測逐漸成為計算機視覺領(lǐng)域的研究熱點之一,具有重要研究意義和應(yīng)用價值。近年來,以卷積神經(jīng)網(wǎng)絡(luò)為核心的深度學(xué)習(xí)技術(shù)在多項機器視覺任務(wù)中展現(xiàn)優(yōu)異性能,極大地啟發(fā)了其在視頻異常事件檢測領(lǐng)域的應(yīng)用。為此,針對近年來基于深度學(xué)習(xí)的視頻異常事件檢測相關(guān)研究進行全面梳理與系統(tǒng)歸納。首先,根據(jù)視頻異常檢測實現(xiàn)流程的三個核心要素,即檢測模式、樣本設(shè)置及學(xué)習(xí)/推理機制,提出一種由淺入深的多級分類方案,面向前沿深度學(xué)習(xí)方法開展逐類概述并提煉代表性算法數(shù)學(xué)模型,同時聚焦現(xiàn)有方法的局限性進行闡述;其次,介紹本領(lǐng)域主流的基準(zhǔn)測試數(shù)據(jù)集,匯總并對比當(dāng)前先進方法在不同數(shù)據(jù)集上的檢測性能;最后,圍繞復(fù)雜光照/天氣條件、多模態(tài)圖像顯著融合、可語義解釋及自適應(yīng)場景感知四個方面對未來重點研究方向進行討論和展望,期望為該領(lǐng)域的后續(xù)研究提供借鑒與參考。(剩余49080字)