[发明专利]一种基于多模块全卷积网络的三维视频视觉注意力检测方法在审
申请号: | 201910300859.7 | 申请日: | 2019-04-15 |
公开(公告)号: | CN109993151A | 公开(公告)日: | 2019-07-09 |
发明(设计)人: | 方玉明;黄汉秦;左一帆;温文媖;万征 | 申请(专利权)人: | 方玉明 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06N3/04 |
代理公司: | 北京科亿知识产权代理事务所(普通合伙) 11350 | 代理人: | 汤东凤 |
地址: | 330013 江西省南昌*** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于多模块全卷积网络的三维视频视觉注意力检测方法,其特征在于:首先利用图片数据集训练静态全卷积网络(S‑FCN)来获取空间特征,从而求得三维视频帧的空间显著性;其次利用二维视频数据集训练动态全卷积网络(T‑FCN)并结合其相应的S‑FCN结果来获取运动信息,从而求得三维视频帧的时间显著性;最后利用三维视频数据集训练深度全卷积网络(D‑FCN)并结合对应的T‑FCN结果来获取深度信息,从而求得三维视频最终的视觉关注图。实验结果在三维视频的视觉关注图中展现了良好的效果。 | ||
搜索关键词: | 卷积 三维视频 三维视频帧 视觉注意力 视觉关注 网络 多模块 显著性 二维视频数据 三维视频数据 空间特征 深度信息 图片数据 运动信息 检测 | ||
【主权项】:
1.一种基于多模块全卷积网络的三维视频视觉注意力检测方法,其特征在于:首先利用静态全卷积网络(S‑FCN)提取空间特征,从而求得三维视频帧的空间显著性;其次利用动态全卷积网络(T‑FCN)提取运动信息,从而求得三维视频帧的时间显著性;最后利用深度全卷积网络(D‑FCN)提取深度信息,求得三维视频帧的最终视觉关注图。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于方玉明,未经方玉明许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910300859.7/,转载请声明来源钻瓜专利网。