摘要:视频异常行为检测作为计算机视觉的研究热点,通过提取视频内容时间和空间特征,判断视频中是否存在异常事件和事件种类,定位异常发生的区域和时间。本文以有监督/无监督学习为线索,对现有视频异常行为检测方法进行系统梳理和归纳。在有监督类方法中,细分为基于偏差均值计算方法和基于多模态方法;无监督类方法中主要总结了基于完全无监督的多种方法。从当前主流建模思路出发对偏差均值计算方法系统性说明,按照不同模态特征的使用及其处理方式对多模态方法进行阐述和总结,根据两种模型训练方式介绍完全无监督方法。对比了不同模型的网络架构,并归纳总结出各类异常行为检测模型的测试数据集、使用场景、优势和局限性。其次,通过基准数据集以帧级标准和像素级标准等常用评价标准进行了模型比较和性能评估,同时通过不同方法的性能表现进行类内对比,并对结果进行分析总结。最后,简要概括未来方向,通过虚拟合成数据集、多模态大模型和轻量级模型等五个方向探究了视频异常行为检测的发展趋势。
文章目录
1 视频异常行为检测概述
2 异常行为检测方法分类
2.1 偏差均值计算
2.2 多模态
2.3 完全无监督
3 数据集
3.1 LAD2000
3.2 UCSD Pedestrian
3.3 CUHK Avenue
3.4 Street Scene
3.5 Subway
3.6 ShanghaiTech
3.7 UBnormal
3.8 XD-Violence
4 评价标准
4.1 帧级标准和像素级标准
4.2 双像素标准
4.3 基于区域的标准
4.4 基于轨迹的标准
5 不同算法实验的比较分析
6 未来研究方向
6.1 虚拟合成数据集
6.2 多模态大模型
6.3 轻量级模型
6.4 人群异常检测
6.5 模型迁移
7 结束语