[发明专利]文字识别建模方法及装置、文字识别方法及电子设备在审
申请号: | 201811559356.3 | 申请日: | 2018-12-19 |
公开(公告)号: | CN109657683A | 公开(公告)日: | 2019-04-19 |
发明(设计)人: | 王彦皓 | 申请(专利权)人: | 北京像素软件科技股份有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06N3/04;G06N3/08 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 王术兰 |
地址: | 102200 北京市昌平区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文字识别 定义文件 文字符号 存储路径 建模 数据库文件 参数定义 初始模型 电子设备 图片文件 文件输入 写入 存储 模型描述文件 测试工具 描述文件 设置参数 生成模型 图片处理 预存 标签 图片 | ||
本发明实施例提供了一种文字识别建模方法及装置、文字识别方法及电子设备,该文字识别建模方法通过对预存的多个文字符号进行分别图片处理,生成与各文字符号对应的文字符号图片并存储到图片文件中,提取图片文件中每个文字符号图片的存储路径并设置标签,生成数据库文件并进行存储,通过设置模型定义文件生成模型描述文件,将数据库文件的存储路径写入模型定义文件,设置参数定义文件将模型定义文件的存储路径写入参数定义文件,再将参数定义文件输入到模型描述文件,生成初始模型,对初始模型进行多次训练以获得caffemodel文件,将获得的caffemodel文件输入到设定的测试工具,获得文字识别模型,由此,获得高识别效率的文字识别模型。
技术领域
本发明涉及文字识别技术领域,具体而言,涉及一种文字识别建模方法及装置、文字识别方法及电子设备。
背景技术
随着互联网的飞速发展,文字识别在越来越多的领域得到的应用,为人们的生产和生活带来了极大的便利。然而,目前的文字识别的识别准确度有待提高。
发明内容
有鉴于此,本发明提供了一种文字识别建模方法及装置、文字识别方法及电子设备。
第一方面,本发明实施例提供了一种文字识别建模方法,所述文字识别建模方法包括:
对预存的多个文字符号进行分别图片处理,生成与各所述文字符号对应的文字符号图片,将所述文字符号图片存储于图片文件中。
提取所述图片文件中每个文字符号图片的存储路径并设置标签,以生成数据库文件并进行存储。
设置模型定义文件,以生成模型描述文件。
将所述数据库文件的存储路径写入所述模型定义文件,对写入所述数据库文件的存储路径后的模型定义文件进行存储。
设置参数定义文件,将所述模型定义文件的存储路径写入所述参数定义文件。
将所述参数定义文件输入到所述模型描述文件,生成初始模型。
对所述初始模型进行多次训练,获得caffemodel文件。
将所述caffemodel文件输入到设定的测试工具,获得文字识别模型。
可选地,在本实施例中,对预存的多个文字符号进行分别图片处理,生成与各所述文字符号对应的文字符号图片,将所述文字符号图片存储于图片文件中的步骤,包括:
根据预存的每个文字符号的形状,生成与该文字符号对应的坐标文件。
根据各所述坐标文件生成与各所述文字符号对应的文字符号图片。
将所述文字符号图片存储于图片文件中。
可选地,在本实施例中,提取所述图片文件中每个文字符号图片的存储路径并设置标签的步骤,包括:
提取所述图片文件中每个文字符号的存储路径。
对同一个文字符号所对应的所有文字符号图片设置同一数字标签。
其中,不同文字符号图片对应不同的数字标签。
可选地,在本实施例中,设置模型定义文件,以生成模型描述文件的步骤,包括:
在所述模型定义文件中进行网络层的定义,以获得模型描述文件。
可选地,在本实施例中,所述模型描述文件包括多个卷积层、多个降采样层、多个全连接层和激活层。
可选地,在本实施例中,设置参数定义文件的步骤,包括:
在所述参数定义文件中进行迭代次数、输出间隔、测试间隔、权重和训练模式的设置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京像素软件科技股份有限公司,未经北京像素软件科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811559356.3/2.html,转载请声明来源钻瓜专利网。