[发明专利]一种文字识别方法、装置、服务器及介质在审
申请号: | 201810088803.5 | 申请日: | 2018-01-30 |
公开(公告)号: | CN108229428A | 公开(公告)日: | 2018-06-29 |
发明(设计)人: | 李承敏;费小平;李封翔;候健 | 申请(专利权)人: | 上海思愚智能科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 200233 上海市徐*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图文信息 特征点 特征点提取 文字识别 服务器 电子笔记本 模型提取 手写输入 所属用户 文字特征 用户体验 用户执行 预先建立 文字库 匹配 个性化 | ||
1.一种文字识别方法,其特征在于,包括:
获取待识别图文信息;
通过预先训练的与所述待识别图文信息所属用户对应的特征点提取模型从所述待识别图文信息中提取出所述待识别图文信息的特征点;
将所述特征点与预先建立的文字库中的文字特征点进行匹配,确定与所述待识别图文信息对应的文字。
2.根据权利要求1所述的方法,其特征在于,所述通过预先训练的与所述待识别图文信息所属用户对应的特征点提取模型从所述待识别图文信息中提取出所述待识别图文信息的特征点包括:
获取与所述待识别图文信息所属用户对应的标识信息;
依据所述标识信息确定与所述待识别文字对应的预先训练的特征点提取模型;
通过所述特征点提取模型提取出所述待识别图文信息的特征点。
3.根据权利要求1所述的方法,其特征在于,在通过预先训练的与所述待识别图文信息所属用户对应的特征点提取模型从所述待识别图文信息中提取出所述待识别图文信息的特征点之前,还包括:
获取原始文字及与所述原始文字对应的标准文字,将所述原始文字及所述标准文字作为待训练的特征点提取模型的文字训练样本;
使用所述文字训练样本对所述待训练的特征点提取模型进行训练,得到训练好的特征点提取模型。
4.根据权利要求3所述的方法,其特征在于,在得到训练好的特征点提取模型之后,还包括:
使用训练好的特征点提取模型提取出各原始文字的特征点,并建立文字库,所述文字库中包含各原始文字的特征点与所述标准文字的对应关系。
5.根据权利要求1所述的方法,其特征在于,所述获取待识别图文信息包括:
获取待识别图文信息的图片;
从所述图片信息中提取所述待识别图文信息的文字轮廓信息。
6.一种文字识别装置,其特征在于,包括:
信息获取模块,用于获取待识别图文信息;
特征点提取模块,用于通过预先训练的与所述待识别图文信息所属用户对应的特征点提取模型从所述待识别图文信息中提取出所述待识别图文信息的特征点;
文字确定模块,用于将所述特征点与预先建立的文字库中的文字特征点进行匹配,确定与所述待识别图文信息对应的文字。
7.根据权利要求6所述的装置,其特征在于,所述特征点提取模块具体用于:
获取与所述待识别图文信息所属用户对应的标识信息;
依据所述标识信息确定与所述待识别文字对应的预先训练的特征点提取模型;
通过所述特征点提取模型提取出所述待识别图文信息的特征点。
8.根据权利要求6所述的装置,其特征在于,还包括:
样本获取模块,用于在通过预先训练的与所述待识别图文信息所属用户对应的特征点提取模型从所述待识别图文信息中提取出所述待识别图文信息的特征点之前,获取原始文字及与所述原始文字对应的标准文字,将所述原始文字及所述标准文字作为待训练的特征点提取模型的文字训练样本;
模型训练模块,用于使用所述文字训练样本对所述待训练的特征点提取模型进行训练,得到训练好的特征点提取模型。
9.一种服务器,其特征在于,所述服务器包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-5中任一所述的文字识别方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5中任一所述的文字识别方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海思愚智能科技有限公司,未经上海思愚智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810088803.5/1.html,转载请声明来源钻瓜专利网。