基于无监督深度学习的视频显著性目标检测方法及系统
本发明公开了一种基于无监督深度学习的视频显著性目标检测方法及系统,涉及目标检测技术领域,包括:基于运动完整性和运动可靠性,选择视频帧的最有效运动,生成视频帧的伪标注;基于视频帧的伪标注得分和视频的伪标注得分,挑选高质量的视频帧的伪标注;采用训练数据增强的策略对静止或运动不完整的目标进行处理,获得增强后的数据,构建训练数据集;将训练数据集作为深度神经网络模型的输入进行模型训练,直至损失函数收敛,获取视频显著性目标检测模型并利用该模型获得视频中的显著性目标。本发明无需大量人工标注好的数据,又能发挥神经网络强大的特征学习能力,训练出来的模型能检测明显运动的目标,也能检测静止或运动不明显的目标。
视频中显著性目标检测,就是检测视频中最受人关注的目标,广泛应用于视频内容理解或场景分析任务中,具有广阔的应用价值。
现有视频显著性目标检测方法,主要分为有监督和无监督学习两种方法。有监督学习主要通过深度学习训练模型,但是需要大量人工标注好的数据;无监督学习主要通过传统的方法设计特征和算法,虽然不需要大量数据标注,但是检测性能远远不如基于深度学习的有监督方法。
因此,如何提出一种既不需要大量人工标注好的数据、又能发挥神经网络强大的特征学习能力的无监督深度学习的方法是本领域技术人员亟需解决的技术问题。
与现有技术相比,本发明公开提供了一种基于无监督深度学习的视频显著性目标检测方法及系统,具有以下有益效果:
(1)本发明不需要任何人工标注,就能够运用深度学习实现视频中的显著性目标检测,并且能够推广到任何应用场景,节省大量的人力物力;
(2)本发明通过最有效运动选择机制和高质量伪真值生成方法,得到可靠的伪真值用于监督模型的训练,可提高视频中显著性目标检测精度;
(3)本发明针对静止或者不完整运动目标的训练数据增强,使模型学习了在没有运动或者运动不完整时也能检测出其中的目标,增强了模型的泛化能力,因此训练出来的模型不仅能检测明显运动的目标,也能很好地检测静止或者运动不明显的目标。
联系方式
黄小明
19303227855
北京市海淀区清河小营东路12号
请填写以下信息
联系人:
手机号:
单位名称:
备注: