[发明专利]一种基于深度投票机制的端到端瞳孔中心定位方法在审

专利信息
申请号: 202210005369.6 申请日: 2022-01-05
公开(公告)号: CN114360040A 公开(公告)日: 2022-04-15
发明(设计)人: 米建勋;袁士尧;陈涛;钱基业;程晓 申请(专利权)人: 重庆邮电大学
主分类号: G06V40/18 分类号: G06V40/18;G06K9/62;G06N3/04;G06N3/08;G06V10/774;G06V10/82
代理公司: 北京同恒源知识产权代理有限公司 11275 代理人: 廖曦
地址: 400065 *** 国省代码: 重庆;50
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 深度 投票 机制 端到端 瞳孔 中心 定位 方法
【权利要求书】:

1.一种基于深度投票机制的端到端瞳孔中心定位方法,其特征在于,该方法具体包括以下步骤:

S1:获取包含人脸的图像集,并对图像集进行标注,然后将标注后的图像集分为训练集和测试集;

S2:构建瞳孔中心定位模型,并将训练集输入模型进行训练;

S3:将测试集中的待定位图像输入训练好的瞳孔中心定位模型,得到最终的瞳孔中心定位坐标。

2.根据权利要求1所述的端到端瞳孔中心定位方法,其特征在于,步骤S1中,通过通用拍摄设备获取自然环境下的包含完整人脸的图像集,其中瞳孔区域必须保证能够由人类标注者进行识别。

3.根据权利要求1所述的端到端瞳孔中心定位方法,其特征在于,步骤S1中,标注者使用标注工具对图像集进行标注,具体包括:对每张图像I,标注两组六维向量,第i组六维向量记作其中用于描述眼部区域标注框的大小,表示眼部区域的中心坐标,(wi,hi)表示眼部区域宽度和高度;用于描述瞳孔中心的信息,表示瞳孔中心的坐标,ci表示落在眼部区域标注框中的样本所属的类别。

4.根据权利要求1所述的端到端瞳孔中心定位方法,其特征在于,步骤S2中,构建并训练瞳孔中心定位模型,具体包括以下步骤:

S21:构建瞳孔中心定位模型:使用卷积神经网络作为特征提取的骨干网络,构建瞳孔中心定位算法头,包含描述子分类器和偏移回归器;

S22:将训练图像I输入骨干网络,提取出特征集F,将特征集F输入瞳孔中心定位算法头,通过描述子分类器和偏移回归器,得到预测的描述子得分集score以及偏移向量集offset;

S23:将步骤S22得到的描述子得分集score以及偏移向量集offset输入损失计算模块,得到损失值;

S24:根据步骤S23计算出的损失值,使用梯度下降优化算法将其回传,对瞳孔中心定位模型进行训练,迭代至收敛;

S25:将样本集输入投票模块以及瞳孔中心抑制模块,得到最终的瞳孔中心定位结果。

5.根据权利要求4所述的端到端瞳孔中心定位方法,其特征在于,步骤S23中,将描述子得分集score以及偏移向量集offset输入损失计算模块得到损失值,具体包括:将特征集F中的各个子集根据各自对应的卷积步长s按照如下公式映射回原始图像,

其中,(x,y)为特征图中的特征点坐标,(x0,y0)为映射回原图的样本坐标,如果样本落入到标注框B的范围内,则此样本被记为正样本,亦即用于为瞳孔中心投票的局部描述子;将描述子得分集score以及偏移向量集offset输入损失计算模块,分别进行分类损失Lreg(o,o*)和回归损失Lcls(p,c*)的计算,计算公式如下:

Lcls(p,c*)=-[α(1-p)γlog p+(1-α)pγlog(1-p)]

其中,p表示一个样本对应的预测得分,c*表示样本对应的类别;γ与α为超参数,用于调整难易样本及正负样本的权重;o代表偏移向量;o*代表偏移向量的真值,o*的计算公式如下:

其中,和分别表示瞳孔中心距离样本(x0,y0)在两个维度上的距离,(xeye,yeye)表示瞳孔中心的真值坐标;

损失计算模块总的损失计算公式如下:

其中,L({p,c*},{o,o*})表示损失计算模块总的损失值;λ为超参数,用于平衡分类和回归损失;Npos为总的描述子数量,是指示函数,当且仅当特征图上坐标为(i,j)的元素对应样本位描述子时为1,其余情况为0。

6.根据权利要求5所述的端到端瞳孔中心定位方法,其特征在于,步骤S25中,将样本集输入投票模块以及瞳孔中心抑制模块,得到最终的瞳孔中心定位结果,具体包括以下步骤:

S251:将待检测的图像I输入步骤S24训练好的模型,经过特征提取模块和瞳孔中心定位算法头,得到特征集F以及描述子得分集score和偏移向量集offset,将特征集F按照各自的步长映射回原图,得到样本集sampleSet;

S252:将步骤S251得到的样本集sampleSet,根据描述子得分进行过滤,得分大于阈值T的样本被选为描述子,得到描述子集descriptorSet;初始化与原图尺寸相同的累加矩阵accMatrix,对每个描述子,将其坐标与对应预测出的偏移向量进行向量加法,得到一组预测的瞳孔中心坐标(ex,ey),在累加矩阵对应位置的bin中加上描述子的得分scoredp,计算公式如下:

其中,dp表示每一个特定的描述子,dpx和dpy表示描述子的坐标,和表示该描述子预测的偏移量;

S253:将步骤S252得到的累加矩阵accMatrix根据其各个bin中的数值大小进行降序排序,排序结果记作sortedBin,取sortedBin中第一个bin的坐标记作EC0,对剩下的全部bin,计算其与EC0的欧氏距离,将超过抑制阈值Tnms的bin从sortedBin剔除,组成抑制集nmsSet,对nmsSet中的每个bin,将其坐标加权至EC0上,得到修正后的EC0,计算公式如下:

EC0+=accMatrixposition·position

sortedBin=sortedBin\bin

其中,position为对应bin在原始累加矩阵中的坐标,accMatrixposition表示累加矩阵accMatrix上对应position处的累加值;

在sortedBin剩下的bin中,取第一个bin的坐标记作EC1,再进行上述操作,得到修正后的EC1,EC0与EC1作为最终定位的瞳孔中心返回。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210005369.6/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top