[发明专利]建立文字识别模型的方法、装置、设备和计算机存储介质有效
申请号: | 201910515396.6 | 申请日: | 2019-06-14 |
公开(公告)号: | CN110378346B | 公开(公告)日: | 2021-12-24 |
发明(设计)人: | 姚锟;孙逸鹏;黎健成;韩钧宇;刘经拓;丁二锐 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/62;G06N3/04 |
代理公司: | 北京鸿德海业知识产权代理有限公司 11412 | 代理人: | 田宏宾 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 建立 文字 识别 模型 方法 装置 设备 计算机 存储 介质 | ||
1.一种建立文字识别模型的方法,其特征在于,所述方法包括:
获取训练数据,所述训练数据中包含各文字图像以及各文字图像中所包含文字的识别结果,所述各文字图像属于预设应用领域;
确定搜索空间,所述搜索空间中包含构建模型结构的卷积神经网络和循环神经网络的各参数以及各参数的取值范围;
分别从所述卷积神经网络以及循环神经网络的各参数的取值范围中进行采样,在利用各参数取值的采样结果得到模型结构序列之后,根据所述模型结构序列构建对应的模型结构;
依据所述训练数据获取所述模型结构的奖励值,并确定所述奖励值是否满足预设条件,若否,则转至执行构建模型结构的步骤,直至所述模型结构的奖励值满足预设条件,输出所述模型结构作为最终模型结构;
利用所述训练数据对所述最终模型结构进行训练,直至所述最终模型结构收敛,得到文字识别模型。
2.根据权利要求1所述的方法,其特征在于,在获取训练数据之后,还包括:按照预设比例,将所述训练数据划分为训练集和验证集。
3.根据权利要求1所述的方法,其特征在于,所述从所述卷积神经网络的各参数的取值范围中进行采样包括:
确定所构建的模型结构中卷积神经网络的预设块数;
从所述卷积神经网络的各参数的取值范围中进行相应次数的重复采样,分别得到各块卷积神经网络中各参数取值的采样结果。
4.根据权利要求2所述的方法,其特征在于,所述依据所述训练数据获取所述模型结构的奖励值包括:
依据所述训练数据获取所述模型结构的识别准确率和识别速度;
利用所述识别准确率和识别速度获取模型结构的奖励值。
5.根据权利要求4所述的方法,其特征在于,所述利用所述识别准确率和识别速度获取模型结构的奖励值包括:
将所述识别速度和预设速度进行比较,根据比较结果确定奖励值计算公式;
利用所确定的奖励值计算公式,根据所述预设速度、识别速度以及识别准确率获取所述模型结构的奖励值。
6.根据权利要求4所述的方法,其特征在于,所述利用所述训练数据获取所述模型结构的识别准确率和识别速度包括:
使用所述训练集对所述模型结构进行预设次数的训练之后,再使用所述验证集获取所述模型结构的识别准确率和识别速度。
7.根据权利要求1所述的方法,其特征在于,所述预设条件包括:
在预设次数内得到的奖励值相等;或者
在预设次数内得到的奖励值之间的差值小于或等于预设阈值。
8.根据权利要求1所述的方法,其特征在于,所述利用所述训练数据对所述最终模型结构进行训练,直至所述最终模型结构收敛包括:
将所述训练数据中的各文字图像作为所述最终模型结构的输入,获取所述最终模型结构针对各文字图像的输出结果;
根据所述各文字图像的输出结果与所述训练数据中各文字图像中所包含文字的识别结果确定所述最终模型结构的损失函数;
根据所述最终模型结构的损失函数调整所述最终模型结构的参数,直至所述最终模型结构的损失函数最小化,得到文字识别模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910515396.6/1.html,转载请声明来源钻瓜专利网。