[发明专利]一种基于级联神经网络的多任务虹膜快速定位方法在审
申请号: | 201911415847.5 | 申请日: | 2019-12-31 |
公开(公告)号: | CN111191605A | 公开(公告)日: | 2020-05-22 |
发明(设计)人: | 沈文忠;滕童;毛云丰 | 申请(专利权)人: | 上海电力大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 丁云 |
地址: | 200090 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 级联 神经网络 任务 虹膜 快速 定位 方法 | ||
1.一种基于级联神经网络的多任务虹膜快速定位方法,其特征在于,该方法包括如下步骤:
(1)在原始图像中选取虹膜区域并且标记关键特征点作为Ground Truth数据集;
(2)基于Ground Truth数据集制作训练样本集,包括正样本、中间样本和负样本;
(3)制作训练样本集的标签;
(4)建立级联神经网络,包括依次级联的三个神经网络,第一级神经网络用于虹膜区域候选框分类,第二级神经网络用于对虹膜候选框区域进行分类与区域坐标回归,第三级神经网络用于精确输出虹膜区域和关键特征点的位置信息;
(5)采用有标签的训练样本对级联神经网络进行训练;
(6)将待定位图像输入至训练好的级联神经网络,输出虹膜区域和关键特征点的位置信息。
2.根据权利要求1所述的一种基于级联神经网络的多任务虹膜快速定位方法,其特征在于,步骤(1)具体为:
首先,采用矩形框人工标记虹膜区域,得到虹膜区域的位置信息(x,y,width,height),x,y表示矩形框左上角的横纵坐标,width,height表示矩形框的宽度和高度;
然后,在虹膜区域标记5个关键特征点(xi,yi),i∈{1,2,3,4,5},包括虹膜左右边缘点、瞳孔左右边缘点和瞳孔圆心,xi和yi表示第i个关键特征点的横坐标和纵坐标。
3.根据权利要求2所述的一种基于级联神经网络的多任务虹膜快速定位方法,其特征在于,步骤(2)具体为:
在原始图像中随机裁剪图像块得到3个类别的样本集:
正样本:与Ground Truth的交并比大于等于0.65的图像块;
中间样本:与Ground Truth的交并比介于0.4和0.65之间的图像块;
负样本:与Ground Truth的交并比小于等于0.3的图像块。
4.根据权利要求3所述的一种基于级联神经网络的多任务虹膜快速定位方法,其特征在于,所述的交并比通过如下方式获得:
IOU=S(A∩B)/S(A∪B),
其中,A表示随机裁剪的图像块,B表示Ground Truth区域,即矩形框标记的虹膜区域,S(A∩B)表示A和B相交区域的面积,S(A∪B)表示A和B相并区域的面积。
5.根据权利要求3所述的一种基于级联神经网络的多任务虹膜快速定位方法,其特征在于,步骤(3)具体为:
采用式1归一化虹膜区域左上角坐标,采用式2归一化5个关键特征点坐标;
将正样本的标签记为1,带有归一化后的虹膜区域左上角坐标和关键特征点坐标信息;
中间样本的标签记为-1,带有归一化后的虹膜区域左上角坐标和关键特征点坐标信息;
负样本的标签记为0;
其中,
式1:
其中,offsetx、offsety为归一化得到的虹膜区域左上角横纵坐标,bx、by表示裁剪的图像块的左上角横纵坐标,boxwidth、boxheight表示裁剪的图像块的宽度和高度;
式2:
其中,offsetxi、offsetyi为归一化得到的第i个关键特征点的横纵坐标。
6.根据权利要求1所述的一种基于级联神经网络的多任务虹膜快速定位方法,其特征在于,所述的第一级神经网络为全卷积网络,其输入数据大小为12*12*1,输出两个1x1卷积层。
7.根据权利要求1所述的一种基于级联神经网络的多任务虹膜快速定位方法,其特征在于,所述的第二级神经网络包括依次连接的卷积层和全连接层,所述的卷积层设置多个,第二级神经网络的输入数据大小为24*24*1,输出6x1全连接层。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海电力大学,未经上海电力大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911415847.5/1.html,转载请声明来源钻瓜专利网。