[发明专利]一种基于深度学习的视频兴趣区域人脸摘要方法、设备及其存储设备在审

申请号：	201911002439.7	申请日：	2019-10-21
公开（公告）号：	CN110879970A	公开（公告）日：	2020-03-13
发明（设计）人：	程家明;孔繁东;陈升亮	申请（专利权）人：	武汉兴图新科电子股份有限公司
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/32
代理公司：	武汉知产时代知识产权代理有限公司 42238	代理人：	易滨
地址：	430000 湖北省武汉市东湖新***	国省代码：	湖北;42
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于深度学习视频兴趣区域摘要方法设备及其存储
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于深度学习的视频兴趣区域人脸摘要方法，其特征在于，包括以下步骤：

步骤1：采集百万张亚洲人脸图片训练人脸检测识别模型；

步骤2：对mtcnn_detector人脸检测算法进行改进；

步骤3：利用鼠标选取视频序列图像场景中感兴趣图像；

步骤4：利用步骤2改进的mtcnn_detector算法，完成对步骤3视频序列图像中出现的人脸进行检测，并初始化卡尔曼滤波器；

步骤5：利用facenet人脸识别模型，对步骤4检测到的人脸进行识别；

步骤6：利用二分类算法，判断face net识别的人脸是否是目标人脸；

步骤7：对识别到含有目标人脸的视频图像帧及卡尔曼滤波器预测的人脸位置与二分类判别非目标人脸框重合的图像帧进行视频合成，具体为：改进的mtcnn_detector算法下一帧检测到人脸后，利用facenet对检测到的人脸进行识别，如果facenet计算出的图像帧的特征值与人脸库里面特征值的比值大于阈值，则表明是目标人脸，可直接进行视频合成，如果比值小于阈值则与卡尔曼滤波器预测位置进行重合判断，卡尔曼滤波器以改进的mtcnn_detector算法检测的目标人脸位置为基准，预测下一帧目标人脸位置，若卡尔曼预测位置与mtcnn_detector算法下一帧检测到人脸位置重合，则可进行视频合成。

2.根据权利要求1所述的一种基于深度学习的视频兴趣区域人脸摘要方法，其特征在于，步骤1中所述用于训练模型的人脸图片涵盖多角度、多尺度、多光照变化和背景变化以及较好显著性的特点。

3.根据权利要求1所述的一种基于深度学习的视频兴趣区域人脸摘要方法，其特征在于，步骤2中所述mtcnn_detector算法的改进方法为：结合实际应用对mtcnn_detector算法人脸检测框尺度上限和下限进行动态调节，人脸检测框的下限是待检测图像面积大小的5％，人脸检测框的上限是待检测图像面积大小的90％，通过动态调节可减小检测过程的误检。

4.根据权利要求1所述的一种基于深度学习的视频兴趣区域人脸摘要方法，其特征在于，步骤6中所述二分类算法判断facenet识别的人脸是否是目标人脸的方法为：设定一个阈值，如果facenet计算出的图像帧的特征值与人脸库里面特征值的比值大于阈值，则表明是目标人脸，如果比值小于阈值，则再根据卡尔曼滤波器预测图像帧人脸位置与mtcnn_detector检测框检测到的图像帧人脸位置是否重合进行判断，若重合则证明是目标人脸。

5.根据权利要求1所述的一种基于深度学习的视频兴趣区域人脸摘要方法，其特征在于，步骤7所述阈值设置为0.7。

6.一种存储设备，其特征包括：所述存储设备存储指令及数据用于实现权利要求1～4所述的一种基于深度学习的视频兴趣区域人脸摘要方法。

7.一种基于深度学习的视频兴趣区域人脸摘要设备，其特征在于：包括：处理器及所述存储设备；所述处理器加载并执行所述存储设备中的指令及数据用于实现权利要求1～4所述的一种基于深度学习的视频兴趣区域人脸摘要方法。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于武汉兴图新科电子股份有限公司，未经武汉兴图新科电子股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201911002439.7/1.html，转载请声明来源钻瓜专利网。

上一篇：电力系统外部等值的方法和系统
下一篇：一种基于手机通信大数据的道路拥堵监测方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于深度学习的视频兴趣区域人脸摘要方法、设备及其存储设备在审

专利文献下载