[发明专利]一种基于长短期记忆的二维视频显著性检测方法在审
申请号: | 201910614888.0 | 申请日: | 2019-07-09 |
公开(公告)号: | CN110334718A | 公开(公告)日: | 2019-10-15 |
发明(设计)人: | 方玉明;黄汉秦;乐晨阳 | 申请(专利权)人: | 方玉明 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/00;G06N3/04 |
代理公司: | 北京科亿知识产权代理事务所(普通合伙) 11350 | 代理人: | 汤东凤 |
地址: | 330013 江西省南昌*** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 时序特征 二维视频 显著性 检测 显著性预测 模型结合 显著性图 反卷积 记忆网 融合 卷积 视频 保留 网络 | ||
1.一种基于长短期记忆的二维视频显著性检测方法,其特征在于,包括以下步骤:
步骤1:提取二维视频帧中的短期时序特征,利用3D卷积神经网络3D-ConvNet来提取;
步骤2:提取二维视频帧中的长期时序特征,利用双向长短期记忆网络B-ConvLSTM来提取;
步骤3:将提取的短期和长期的时序特征进行融合,并反卷积得到和输入视频帧分辨率大小一致的显著图。
2.根据权利要求1所述的一种基于长短期记忆的二维视频显著性检测方法,其特征在于:步骤1所述的二维视频帧中的短期时序特征包括运动信息。
3.根据权利要求2所述的一种基于长短期记忆的二维视频显著性检测方法,其特征在于:3D卷积网络按照公式(1)来计算:
hn=σ(∑Wn*hn-1+bn) (1)
其中Wn表示第n-1隐藏层的3D卷积核参数;hn-1代表第n-1隐藏层;bn代表相应的偏置项;操作符‘*’代表卷积操作;σ代表激活函数。
4.根据权利要求2所述的一种基于长短期记忆的二维视频显著性检测方法,其特征在于:利用批量标准化BN算法来加速网路的训练,它的计算由公式(2)所示:
其中E(x(k))和Var(x(k))分别代表第k批数据的期望和方差;代表标准化之后的结果。
5.根据权利要求4所述的一种基于长短期记忆的二维视频显著性检测方法,其特征在于:批量标准化BN算法之后,对于改变原始数据的分布,采用公式(3)来调整:
其中γ(k)和β(k)是相应的调节参数;代表标准化BN算法之后的结果;y(k)代表调整之后的结果。
6.根据权利要求1所述的一种基于长短期记忆的二维视频显著性检测方法,其特征在于:步骤2所述的二维视频帧中的长期时序特征包括运动信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于方玉明,未经方玉明许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910614888.0/1.html,转载请声明来源钻瓜专利网。