[发明专利]基于量子Grover算法的手写文字图片分类方法有效
申请号: | 202011411791.9 | 申请日: | 2020-12-04 |
公开(公告)号: | CN112507863B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 李阳阳;赵逸群;刘睿娇;赵裴翔;毛鹤亭;杨丹青;焦李成;李玲玲 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06V30/226 | 分类号: | G06V30/226;G06V30/14;G06V30/19;G06V10/82;G06N3/0464;G06N3/048;G06N3/084 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 田文英;张问芬 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 量子 grover 算法 手写 文字 图片 分类 方法 | ||
1.一种基于量子Grover算法的手写文字图片分类方法,其特征在于,构建并训练卷积神经网络,用于提取手写文字图片特征向量,利用Grover搜索算法对手写文字图片进行分类,该方法包括如下的步骤:
(1)构建卷积神经网络:
(1a)构建一个14层的卷积神经网络,其结构依次为:输入层,第1卷积层,第1池化层,第1批量归一化层,第2卷积层,第2池化层,第2批量归一化层,第3卷积层,第3池化层,第3批量归一化层,第4卷积层,第4池化层,全连接层,输出层;
(1b)设置卷积神经网络的各层参数如下:
将输入层的通道数设置为1;
将第1至第4卷积层中卷积核的个数分别设置为64,128,256,512,卷积核的大小均设置为3×3,步长均设置为1;
第1至第3池化层均采用最大池化的方式,第4池化层采用平均池化的方式,第1至第4池化层的池化窗口大小均设置为2×2,步长均设置为2;
全连接层和输出层的节点个数均设置为1024个;
输出层的激活函数设置为sigmoid函数;
(2)生成训练集:
(2a)采集包含至少3000类别数的至少120000张灰度手写文字图片,每一类包含至少40张的灰度手写文字图片,每张灰度图片中仅含有一个手写文字;
(2b)对每张灰度图片中的每个像素进行二值化处理;将二值化处理后的图片裁剪为文字字体刚好接触到图片四条边的图片;将裁剪后的图片大小缩放到64×64个像素点;将所有缩放后的图片组成训练集;
(3)生成训练数据集:
(3a)从训练集中随机选择并复制两张图片组成一个训练数据,若所选两张图片的类别相同,则将该训练数据的标签设置为1,若不相同,将该训练数据的标签设置为0;
(3b)重复执行步骤(3a)120000次,将得到的所有训练数据组成训练数据集;
(4)训练卷积神经网络:
将训练数据集输入到卷积神经网络中,利用梯度下降法迭代更新网络权值直至对比损失函数的值收敛,得到训练好的卷积神经网络;
(5)生成模板库:
(5a)从训练集中随机取出一张图片,将所选图片输入到卷积神经网络中,输出该图片的特征向量,利用阶跃函数将该特征向量中的每个元素值转换为0或1,
得到转换后的特征向量,将所选图片的类别作为转换后特征向量的类别;
(5b)重复执行步骤(5a)直至取完训练集中的所有图片,将所有转换后的特征向量组成模板库;
(6)提取待分类图片的特征向量:
(6a)采用与步骤(2)相同的方法,对每张待分类的灰度图片进行处理,得到该张图片对应的大小为64×64个像素点的处理后图片;每张待分类的灰度图片中仅含有一个手写文字;
(6b)将每张处理后图片输入到卷积神经网络中,输出该图片的特征向量,利用与步骤(5)相同的方法,将每个特征向量中的每个元素值转换为0或1,得到转换后的特征向量;
(6c)将所有转换后的特征向量组成待分类图片特征向量集;
(7)利用量子Grover算法对手写文字图片进行分类:
(7a)制备包含18个量子比特的量子位,利用对应函数将量子位前17个量子比特产生的每个量子状态与模板库中的特征向量或长度等于模板库中单个特征向量长度且每个元素值均为0的一维向量建立映射关系;
所述对应函数如下:
其中,T(·)表示对应函数,x表示量子位前17个量子比特产生的所有量子状态中量子状态的序号,Pt表示模板库中第t个特征向量,t表示模板库中特征向量的序号,t的取值与x的值相等,Z表示长度等于模板库中单个特征向量长度且每个元素值均为0的一维向量;
(7b)从待分类图片特征向量集中取出一个特征向量,利用匹配函数,分别计算所选特征向量与量子位前17个量子比特产生的每个量子状态映射的向量的匹配值,再使用翻转函数,将映射的向量与特征向量匹配后的每个量子状态的概率幅进行翻转;
所述的匹配函数如下:
其中,f(·)表示匹配函数,a表示从待分类图片特征向量集中所选的特征向量,bx表示量子位前17个量子比特产生的量子状态中第x个量子状态映射后的向量;
所述翻转函数如下:
其中,G(·)表示翻转函数,mx表示第x个量子状态映射的向量与从待分类图片特征向量集中所选特征向量的匹配值,ωx表示第x个量子状态的概率幅;
(7c)重复执行步骤(7b)346次,从量子位的前17个量子比特的所有量子状态中找出概率幅最大的量子状态,将该概率幅最大的量子状态映射向量的类别作为所选特征向量的类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011411791.9/1.html,转载请声明来源钻瓜专利网。