[发明专利]人脸姿态识别模型的训练方法及其系统和装置有效
申请号: | 202010200187.5 | 申请日: | 2020-03-20 |
公开(公告)号: | CN111401456B | 公开(公告)日: | 2023-08-22 |
发明(设计)人: | 杨波 | 申请(专利权)人: | 杭州涂鸦信息技术有限公司 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V40/16;G06V10/764;G06V10/82;G06V10/84;G06N3/0464;G06N3/047;G06N3/048;G06N7/01 |
代理公司: | 北京崇智知识产权代理有限公司 11605 | 代理人: | 赵丽娜 |
地址: | 310013 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 姿态 识别 模型 训练 方法 及其 系统 装置 | ||
本发明涉及图像识别技术领域,尤其涉及人脸姿态识别模型的训练方法及其系统和装置。基于卷积神经网络和概率模型的人脸姿态识别模型的训练方法,包括以下步骤:根据预设理想误差分别对方向角roll、yaw、pitch角度值设置阈值间隔,所述方向角roll、yaw、pitch的角度值分别转换为不同的方向角类别;依据概率模型对所述人脸姿态方向角roll,yaw,pitch角度值的方向角分类类别进行联合训练。该方法具有准确率高、实时结果稳定、复杂场景下鲁棒性好、网络结构简单适合全平台部署等优点。
技术领域
本发明涉及图像识别技术领域,尤其涉及人脸姿态识别模型的训练方法及其系统和装置。
背景技术
人脸姿态(pose)识别属于人脸属性识别,在人脸图像分析中起着重要作用。各种基于人脸的实际应用比如人脸识别、人脸属性识别等等,尤其在多平台、多场景的环境中,都依赖人脸姿态准确稳定的识别。人脸姿态主要由三个方向角也称欧拉角roll,yaw,pitch决定,其中roll方向角表示平面内人脸的旋转角度,范围为[-180,180],yaw角表示三维旋转之左右旋转角,范围为[-90,90],pitch角表示三维旋转之俯仰角[-90,90]。
目前卷积神经网络在计算机视觉任务中取得了显著的进步,特别是在图像领域,基于卷积神经网络的深度学习方法比传统方法效果有明显的提升。
在传统人脸姿态识别方法中,一般基于特征模板匹配和检测器分类方法,这类传统方法提取的有效人脸特征没有基于卷积神经网络提取的特征丰富,往往造成模型鲁棒性差,遇到复杂场景准确性会严重下降。而基于卷积神经网络的方法相比之下会大大提高模型鲁棒性,可以适应更复杂场景的人脸姿态识别。基于卷积神经网络的人脸姿态识别方法大多依赖人脸特征关键点,然后通过人脸特征关键点来计算人脸姿态角。这类方法的识别准确性依赖人脸特征关键点的定位精度,一旦出现大角度人脸比如侧脸、低头、遮挡等情况,或者出现复杂场景比如弱光、强光、逆光等情况,关键点定位精度会出现下降,进而影响人脸姿态识别准确性,特别是在实时人脸姿态识别情况下结果的稳定性和准确性都会严重降低。相对来说人脸特征关键点个数越多,人脸姿态识别结果就越准,但是往往会增加关键点定位模型的计算量和参数量,这样模型不适合在低算力的芯片平台上部署,造成一定的局限性。
发明内容
本发明提供一种基于卷积神经网络和概率模型的人脸姿态识别模型的训练方法,该发明采用卷积神经网络和概率模型方法预测人脸姿态角(roll,yaw,pitch),以解决现有方法依赖人脸关键点定位、大角度人脸姿态pose识别不准确、实时识别结果不够稳定、复杂场景下鲁棒性差等问题,该发明方法支持人脸姿态角中roll角[-180,180]或者[-90,90],yaw角[-90,90],pitch角度[-90,90]范围内识别,具有准确率高、实时结果稳定、复杂场景下鲁棒性好、网络结构简单适合全平台部署等优点。
为实现上述目的,本发明第一方面的技术方案提供了基于卷积神经网络和概率模型的人脸姿态识别模型的训练方法,包括以下步骤:
(a)根据预设理想误差分别对方向角roll、yaw、pitch角度值设置阈值间隔,所述方向角roll、yaw、pitch的角度值分别转换为不同的方向角类别;
其中,分类类别数与区间间隔范围的计算公式如下:
intervali=[minvalue+i*bins,minvalue+(i+1)*bins);
minvalue和maxvalue分别表示方向角范围的最大值和最小值,cnum表示分类类别数,bins表示阈值间隔,intervali表示第i个类别的角度值范围,下标i∈[0,cnum-1];
(b)依据概率模型对所述人脸姿态方向角roll,yaw,pitch角度值的方向角分类类别进行联合训练;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州涂鸦信息技术有限公司,未经杭州涂鸦信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010200187.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于互联网出行的车载多媒体控制方法、装置和服务端
- 下一篇:一种电力检修梯