[发明专利]显著特征检测方法和装置在审
申请号: | 201810404837.0 | 申请日: | 2018-04-28 |
公开(公告)号: | CN110163196A | 公开(公告)日: | 2019-08-23 |
发明(设计)人: | 李冠彬;谢园;王巨宏;黄婷婷 | 申请(专利权)人: | 中山大学;腾讯科技(深圳)有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/00;G06T7/269 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 何平;邓云鹏 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 显著特征 参考帧 目标帧 神经网络模型 方法和装置 视频帧序列 检测 编码图像 图像变换 光流图 协同 计算目标 输出目标 特征输入 图像特征 像素级别 分类器 显著图 申请 视频 | ||
1.一种显著特征检测方法,包括:
获取视频帧序列,所述视频帧序列包括目标帧和多个参考帧;
计算所述目标帧与各所述参考帧之间的光流图;
通过第一神经网络模型,对各所述光流图进行编码,分别得到各所述参考帧对应的图像变换特征;
通过第二神经网络模型,根据各所述图像变换特征对所述目标帧的图像特征进行编码,得到所述目标帧的协同编码图像特征;
将所述协同编码图像特征输入像素级别分类器进行检测,输出所述目标帧的显著图。
2.根据权利要求1所述的方法,其特征在于,所述计算所述目标帧与各所述参考帧之间的光流图,包括:
确定所述目标帧中各像素点的第一位置;
在各所述参考帧中查找与所述目标帧中各像素点相应的像素点,确定查找的各像素点的第二位置;
根据所述第一位置和所述第二位置的偏移计算得到所述目标帧与各所述参考帧之间的光流图。
3.根据权利要求2所述的方法,其特征在于,所述根据所述第一位置和所述第二位置的偏移计算得到所述目标帧与各所述参考帧之间的光流图,包括:
将所述第一位置的水平位置和所述第二位置的水平位置作差,获得所述目标帧中各像素点相对于各所述参考帧中相应的像素点的水平位置偏移;
将所述第一位置的竖直位置和所述第二位置的竖直位置作差,获得所述目标帧中各像素点相对于各所述参考帧中相应的像素点的竖直位置偏移;
根据所述水平位置偏移和所述竖直位置偏移构建二通道矩阵向量,以获得所述目标帧与各所述参考帧之间的光流图。
4.根据权利要求1所述的方法,其特征在于,所述通过第一神经网络模型,对各所述光流图进行编码,分别得到各所述参考帧对应的图像变换特征,包括:
通过所述第一神经网络模型,对所述光流图进行编码,得到各所述光流图对应的编码光流图;
获取所述目标帧的图像特征及各所述参考帧的图像特征;
基于各所述编码光流图,对各所述参考帧对应的图像特征进行线性变换,得到各所述参考帧对应的图像变换特征。
5.根据权利要求4所述的方法,其特征在于,所述通过第一神经网络模型,对各所述光流图进行编码,得到各所述光流图对应的编码光流图,包括:
将各所述光流图输入所述第一神经网络模型;
在所述第一神经网络模型的隐层中,按照所述视频帧序列中各所述参考帧的先后顺序,对各所述光流图进行依次处理得到所述第一神经网络模型对应各所述光流图的隐藏状态;
通过所述第一神经网络模型的卷积层,对得到的各所述隐藏状态进行降维处理,得到各所述光流图对应的编码光流图。
6.根据权利要求5所述的方法,其特征在于,所述在所述第一神经网络模型的隐层中,按照所述视频帧序列中各所述参考帧的先后顺序,对各所述光流图进行依次处理得到所述第一神经网络模型对应各所述光流图的隐藏状态,包括:
按照所述视频帧序列中各所述参考帧的先后顺序,逆序地将各所述光流图作为所述第一神经网络模型的隐层当前处理的光流图;
在当前处理的光流图是所述目标帧与所述视频帧序列中末尾的参考帧之间的光流图时,则通过所述隐层根据所述目标帧与各所述参考帧之间的光流图得到初始的隐藏状态;
在当前处理的光流图不是所述目标帧与所述视频帧序列中末尾的参考帧之间的光流图时,则通过所述隐层根据当前处理的光流图、前次处理的光流图相应的隐藏状态得到当前处理的光流图相应的隐藏状态。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学;腾讯科技(深圳)有限公司,未经中山大学;腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810404837.0/1.html,转载请声明来源钻瓜专利网。