[发明专利]人脸特征点检测增强方法及装置在审
申请号: | 201710856765.9 | 申请日: | 2017-09-21 |
公开(公告)号: | CN107516092A | 公开(公告)日: | 2017-12-26 |
发明(设计)人: | 袁家劼 | 申请(专利权)人: | 天津呼噜互娱科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06T7/277 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙)11371 | 代理人: | 张红平 |
地址: | 300457 天津市滨海新区中新生态城中成大道*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征 检测 增强 方法 装置 | ||
技术领域
本发明涉及人脸识别的技术领域,尤其是涉及一种人脸特征点检测增强方法及装置。
背景技术
随着智能硬件的飞速发展,人工智能与机器学习的成果越来越多的应用到了移动端,人脸检测与人脸特征点检测的技术被更多的手机APP使用。一些简单的美图软件,视频交互软件,AR特效软件等等,都使用到了人脸检测和特征点检测的技术。
然而,目前的特征点检测技术在实时的视频中存在定位抖动的问题,当然这些问题可以通过不停的加大训练样本,完善特征定位模型,以及多帧平均的方式减缓其抖动的幅度。但是这些改进又会带来新的问题,比如增大样本训练模型,相当于直接增加模型的成本。样本的扩充可能需要几十到上百万的标注样本,以数据堂的标注样本售价为标准,一张标注好的样本成本在1.5元以上,所以模型迭代基本以百万的耗资为基数。更离谱得是,模型就算训练得再好,也不能消除抖动,最多只能减缓其趋势。其次是多帧的预测结果作均值,这样虽然可以有效得消除抖动,但是如果视频中的人物头部运动较剧烈就会产生严重得拖影,反馈在用户上的感觉就像是渲染在头部的特效并没有与渲染部位完美得融合,而像是被头部拖着跑,严重影响用户体验。
发明内容
有鉴于此,本发明的目的在于提供一种人脸特征点检测增强方法及装置,以缓解了现有技术中存在的在采用传统的人脸特征检测技术检测人脸特征点时稳定性较差的技术问题。
第一方面,本发明实施例提供了一种人脸特征点检测增强方法,包括:获取当前时刻待处理的视频帧图像;通过预设特征点检测算法和卡尔曼滤波算法在所述视频帧图像中对预设人脸特征点进行预测,分别得到第一预测特征点和第二预测特征点,其中,所述预设人脸特征点为预先分配卡尔曼滤波器的特征点;对所述第一预测特征点和所述第二预测特征点进行分析,以根据分析结果确定所述视频帧图像的人脸特征点的预测值。
进一步地,对所述预测特征点和所述第二预测特征点进行分析,以根据分析结果确定所述视频帧图像的人脸特征点的预测值包括:计算所述第一预测特征点和所述第二预测特征点之间的坐标距离;判断所述坐标距离是否小于预设距离;当所述坐标距离小于所述预设距离时,则确定所述视频帧图像的人脸特征点的预测值为所述第一预测特征点;当所述坐标距离大于所述预设距离时,则确定所述视频帧图像的人脸特征点的预测值为所述第二预测特征点。
进一步地,所述预设特征点的数量为多个,计算所述第一预测特征点和所述第二预测特征点之间的坐标距离包括:依次计算第一特征点i与第二特征点j之间的坐标距离,得到多个坐标距离,所述第一特征点i为所述第一预测特征点中的特征点,所述第二特征点j为所述第二预测特征点中的特征点,且所述第一特征点i和所述第二特征点j对应相同的预设人脸特征点。
进一步地,判断所述坐标距离是否小于预设距离包括:判断所述多个坐标距离中的每个坐标距离是否均小于所述预设距离;其中,如果判断出是,则确定所述视频帧图像的人脸特征点的预测值为所述第一预测特征点;如果判断出否,则基于所述坐标距离中小于所述预设距离的数量确定所述视频帧图像的人脸特征点的预测值。
进一步地,基于所述坐标距离中小于所述预设距离的数量确定所述视频帧图像的人脸特征点的预测值包括:判断所述数量是否大于预设数量;如果判断出是,则确定所述视频帧图像的人脸特征点的预测值为所述第一预测特征点;如果判断出否,则确定所述视频帧图像的人脸特征点的预测值为所述第二预测特征点。
进一步地,在获取当前时刻待处理的视频帧图像之前,所述方法还包括:获取预先设置的待预测的人脸特征点;为每个所述人脸特征点预先分配一个卡尔曼滤波器。
第二方面,本发明实施例还提供一种人脸特征点检测增强装置,包括:第一获取单元,用于获取当前时刻待处理的视频帧图像;预测单元,用于通过预设特征点检测算法和卡尔曼滤波算法在所述视频帧图像中对预设人脸特征点进行预测,分别得到第一预测特征点和第二预测特征点,其中,所述预设人脸特征点为预先分配卡尔曼滤波器的特征点;分析单元,用于对所述第一预测特征点和所述第二预测特征点进行分析,以根据分析结果确定所述视频帧图像的人脸特征点的预测值。
进一步地,所述预测单元包括:计算模块,用于计算所述第一预测特征点和所述第二预测特征点之间的坐标距离;判断模块,用于判断所述坐标距离是否小于预设距离;第一确定模块,用于当所述坐标距离小于所述预设距离时,则确定所述视频帧图像的人脸特征点的预测值为所述第一预测特征点;第二确定模块,用于当所述坐标距离大于所述预设距离时,则确定所述视频帧图像的人脸特征点的预测值为所述第二预测特征点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津呼噜互娱科技有限公司,未经天津呼噜互娱科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710856765.9/2.html,转载请声明来源钻瓜专利网。