[发明专利]一种视频感兴趣区域的提取方法和系统有效
申请号: | 202210350590.5 | 申请日: | 2022-04-02 |
公开(公告)号: | CN114782676B | 公开(公告)日: | 2023-01-06 |
发明(设计)人: | 陈祥;王立冬;金强;李硕;韩强;赵宏伟;张文东;周骋 | 申请(专利权)人: | 北京广播电视台;北京数码视讯软件技术发展有限公司 |
主分类号: | G06V10/25 | 分类号: | G06V10/25;G06V10/82;G06V10/80;G06V10/764;G06V20/40;G06N3/04 |
代理公司: | 北京国帆知识产权代理事务所(普通合伙) 11334 | 代理人: | 刘小哲 |
地址: | 100022 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 感兴趣 区域 提取 方法 系统 | ||
1.一种视频感兴趣区域的提取系统,其特征在于包括,采样模块(1)、初始特征提取模块(2)、多阶段特征提取·下采样模块(3)、融合特征图生成模块(4)、检测模块(5)、输出模块(6),
所述采样模块(1),逐帧输入视频的原始图像,对所述原始图像进行下采样,得到低分辨率多通道图像;
所述初始特征提取模块(2)由卷积神经网络构成,对输入的低分辨率多通道图像进行特征提取,得到多维初始特征图;
所述多阶段特征提取·下采样模块(3),由多个串联的卷积神经网络构成,对输入的所述多维初始特征图多阶段地提取特征和下采样,得到分辨率逐渐降低的第一至第n特征图;
所述融合特征图生成模块(4),对所述第n特征图上采样,与第n-1特征图的分辨率对齐后与第n-1特征图做相加操作(31a),得到的特征图继续上采样,与第n-2特征图的分辨率对齐后与第n-2特征图做相加操作(31b),重复对得到的特征图进行上采样和相加操作,直至与第一特征图融合,得到融合特征图;
所述检测模块(5),由卷积神经网络构成,对输入的所述融合特征图进行分类,得到矩形区域的坐标值、长宽信息和概率值;
所述输出模块(6),将所述矩形区域的概率值由大到小排序,选取规定个数概率值大的矩形区域作为感兴趣区域(ROI),输出其坐标值、长宽信息,
所述神经网络中通过训练,获取检测感兴趣特征的权重,
其中,所述初始特征提取模块(2)的神经网络包括,串联的第一卷积层(21)、第一非线性激活层(22)、第二卷积层(23),所述低分辨率多通道图像输入所述第一卷积层(21)提取特征,提取的特征图输入所述第二卷积层(23)提取特征,第一卷积层(21)提取的特征图与第二卷积层(23)提取的特征图做相加操作(24)得到多维初始特征图。
2.根据权利要求1所述的一种视频感兴趣区域的提取系统,其特征在于,视频中的人脸、台标、字幕作为感兴趣特征,所述神经网络通过训练获取检测人脸、台标、字幕的权重。
3.根据权利要求1或2所述的一种视频感兴趣区域的提取系统,其特征在于,
所述输出模块(6)输出的矩形的坐标值、长宽信息用于对所述视频进行编码时,确定所述矩形区域内的编码策略,
所述输出模块(6),在输出所述矩形区域信息前,判断所述矩形区域在所述原始图像中覆盖的最大编码单元,有边界落在所述矩形区域外的最大编码单元时,调整所述矩形区域的坐标值、长宽信息,使所述矩形区域,即感兴趣区域(ROI)完整涵盖整个最大编码单元。
4.根据权利要求1所述的一种视频感兴趣区域的提取系统,其特征在于,
所述多阶段特征提取·下采样模块(3),由三个串联的卷积神经网络(31)构成,对输入的所述多维初始特征图三阶段地提取特征和下采样,下采样的倍率为1/2,得到分辨率成整数倍降低的第一至第三特征图,
所述融合特征图生成模块(4),对所述第三特征图上采样,与第二特征图的分辨率对齐后与第二特征图做相加操作(31a),得到的特征图继续上采样,与第一特征图的分辨率对齐后与第一特征图做相加操作(31b),得到融合特征图。
5.根据权利要求4所述的一种视频感兴趣区域的提取系统,其特征在于,
所述检测模块(5)的卷积神经网络包括卷积层(51)、全连接层(52),由所述卷积层(51)将所述融合特征图展开成一维向量,所述全连接层(52)对所述一维向量进行分类,得到疑似感兴趣区域的坐标值、长宽信息和概率值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京广播电视台;北京数码视讯软件技术发展有限公司,未经北京广播电视台;北京数码视讯软件技术发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210350590.5/1.html,转载请声明来源钻瓜专利网。