[发明专利]基于卷积神经网络深度学习模型的光学字符识别方法在审

申请号：	201810270374.3	申请日：	2018-03-28
公开（公告）号：	CN108681735A	公开（公告）日：	2018-10-19
发明（设计）人：	陆成学	申请（专利权）人：	中科博宏（北京）科技有限公司
主分类号：	G06K9/34	分类号：	G06K9/34;G06K9/62;G06N3/08
代理公司：	暂无信息	代理人：	暂无信息
地址：	100083 北京市海淀区天秀***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	光学字符识别卷积神经网络学习优化目标函数阿拉伯数字训练集图像训练数据库测试样本多分类器分类结果模式分类生成模型特征提取图片格式文本识别英文字母应用模型字符识别分类器鲁棒性数据集正确率应用字体汉字扭曲转换监督图片
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于卷积神经网络深度学习模型的光学字符识别方法，其特征在于，该方法的具体步骤包括：

步骤S1，收集常用的不同字体的汉字，10个阿拉伯数字和26个英文字母并生成图片格式的数据集。

步骤S2，对获取的训练集和测试集样本适当进行轻微的旋转和扭曲处理。

步骤S3，优化学习训练集的分类器的各层权值矩阵参数W和偏置b，通过随机梯度下降法(SGD)的优化方式最小化目标函数，学习最优分类器参数W和b。

2.根据权利要求1所述的基于卷积神经网络深度学习模型的光学字符识别方法，其特征在于，在所述步骤S1中，收集所有身份证涉及到的常用汉字和10个阿拉伯数字以及26个英文字母。

3.根据权利要求1所述的基于卷积神经网络深度学习模型的光学字符识别方法，其特征在于，在步骤S2中，对训练集和测试集样本进行不相同程度的轻微扭曲和旋转，将处理后的图像作为输入特征。

4.根据权利要求1所述的基于卷积神经网络深度学习模型的光学字符识别方法，其特征在于，在步骤S3中，深度学习模型的优化需要通过随机梯度下降法迭代优化策略来完成，具体的过程总结如下：

S31，对于训练集中的每一个卷积层的多个卷积核，通过高斯分布初始化权值矩阵。接下来，进入交替误差前向传播和梯度反向传播过程，通过SGD算法同时给出其每个卷积核的权值。循环S32和S33直到收敛或达到迭代次数要求。

S32，前向传播计算损失函数的值：

这是一个典型的分类问题的目标函数，完成这一目标函数的优化就可以求得一组分类参数W和b。

S33，反向传播计算损失函数对各个参数的梯度值。

其中，f是隐含层。

5.根据权利要求1所述的基于卷积神经网络深度学习模型的光学字符识别方法，其特征在于，在步骤S3中，在模型训练之后，对于一个新来的测试样本y_test，在当前学到深度学习模型中预测其值。其具体操作步骤如下：

S4，进行一次前向传播，计算其所属各个类别的概率值。

其中，s_i＝g(x_i；W，b)，i＝1，2，...m。

6.根据权利要求5所述的基于卷积神经网络深度学习模型的光学字符识别方法，其特征在于，在步骤5中，计算所有类别的概率值后，根据概率值的大小确定最后的分类结果。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中科博宏（北京）科技有限公司，未经中科博宏（北京）科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201810270374.3/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载