[发明专利]基于深度学习的眼白图像超分辨率重建与图像增强方法有效
申请号: | 201711158278.1 | 申请日: | 2017-11-20 |
公开(公告)号: | CN107944379B | 公开(公告)日: | 2020-05-15 |
发明(设计)人: | 孙哲南;李琦;刘明康 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34;G06K9/46;G06N3/08 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 任岩 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 眼白 图像 分辨率 重建 增强 方法 | ||
1.一种基于深度学习的眼白图像超分辨率重建与图像增强的方法,包括:
步骤S1,采集人脸视频、帧采样获取人脸图像;
步骤S2,通过人脸图像提取双眼区域,关键点定位分割左右眼白,获得眼白图像;
步骤S3,通过训练卷积神经网络结合递归神经网络,利用深度学习对眼白图像做超分辨率重建,获得高分辨率眼白图像,识别眼白血管纹理特征;
步骤S4,将RGB空间域的眼白图像转换到HSV空间域,对高分辨率眼白图像做真彩色图像增强;
其中,步骤S3包括:
S31.将RGB眼白图像转换到YCbCr空间域,初始化卷积神经网络;
S32.利用嵌入式网络提取特征补丁,再通过一组预先训练基础表示所述嵌入式网络,嵌入式网络f1(x)取输入向量x并计算作为递归网络f2的输入的矩阵输出H0,所述嵌入式网络为:
f1(x)=H0 (1)
H-1=max(0,W-1*x+b-1) (2)
H0=max(0,W0*H-1+b0) (3)
其中,运算符*表示卷积,W-1,W0和b-1,b0为重量和偏置矩阵;第一层操作是:
F1(Y)=max(0,W1*y+B1) (4)
其中,W1与B1分别表示滤波器和偏置,W1对眼白图像应用n1卷积,输出由n1特征图组成;B1是n1维向量,每个元素与滤波器相关联,在滤波器响应上应用整流线性单元[ReLU(max(0,x))];
S33.在非线性变换操作中,通过递归网络将步骤S32中提取每个补丁图像块的n1维特征映射为n2维:
F2(Y)=max(0,W2*F1(Y)+B2) (5)
其中,W2包含大小为n1×f2×f2的n2个滤波器,B2为n2维向量,每个输出n2维向量是用于重建的高分辨率补丁的表示;
在非线性变换中的所述递归网络f2采用输入矩阵H0并计算矩阵输出HD;
令g表示由递归层的单个递归建模的函数:
g(H)=max(0,W*H+b) (6)
复发关系是:
Hd=g(Hd-1)=max(0,W*Hd-1+b) (7)
其中,W和b为重量矩阵和偏置矩阵;对于d=1,…,D,递归网f2相当于组合相同的基本功能g:
其中,运算符表示函数组合,gD表示g的D折积;
S34.采用重建网络进行眼白图像超分辨率重建,所述重建网络f3采用输入隐藏状态HD并输出目标图像,重建网络是嵌入式网络的逆运算:
HD+1=max(0,WD+1*HD+bD+1) (9)
y’=max(0,WD+2*HD+1+bD+2) (10)
f3(H)=y’ (11)
将上述高分辨率补丁聚合成表示已生成最终的高分辨率眼白图像,即定义卷积层以生成最终的高分辨率眼白图像:
F(Y)=W3*F2(Y)+B3 (12)
其中,W3是一组线性滤波器,尺寸为n2×f3×f3×c;B3是c维矢量;
步骤S35,将高分辨率的YCbCr眼白图像转化为RGB图像,再返回到原始眼白图像数据库以确认是否有剩余低分辨率眼白图像未经超分辨率重建工作,若仍有剩余图像未经该步处理,则返回至步骤S31;如果眼白图像数据库没有剩余,则进行步骤S4。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711158278.1/1.html,转载请声明来源钻瓜专利网。