[发明专利]文本信息处理方法及装置有效

申请号：	201911000662.8	申请日：	2019-10-21
公开（公告）号：	CN110765996B	公开（公告）日：	2022-07-29
发明（设计）人：	冯博豪;陈兴波;张小帅;杨舰	申请（专利权）人：	北京百度网讯科技有限公司
主分类号：	G06V10/22	分类号：	G06V10/22;G06F40/232
代理公司：	北京英赛嘉华知识产权代理有限责任公司 11204	代理人：	王达佐;马晓亚
地址：	100085 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本申请的实施例公开了文本信息处理方法及装置，涉及云计算领域。该方法的一具体实施方式包括：从包括待处理文本的图像中识别出待处理文本；将待处理文本输入预先训练的循环神经网络语言模型，识别待处理文本中的错别字；将待处理文本中的错别字输入预先训练的文本纠错模型，得到错别字对应的相似字；利用文本纠错模型，基于待处理文本的连贯性，确定相似字中与错别字对应的正确文字，采用正确文字替换错别字，得到待处理文本的纠错文本。本申请通过预先训练的循环神经网络语言模型识别错别字，通过预先训练的文本纠错模型得到错别字的正确文字，从而得到纠错文本，提高了识别结果的准确度。
搜索关键词：	文本信息处理方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种文本信息处理方法，其中，所述方法包括：/n从包括待处理文本的图像中识别出所述待处理文本；/n将所述待处理文本输入预先训练的循环神经网络语言模型，识别所述待处理文本中的错别字；/n将所述待处理文本中的错别字输入预先训练的文本纠错模型，得到所述错别字对应的相似字；/n利用所述文本纠错模型，基于所述待处理文本的连贯性，确定所述相似字中与所述错别字对应的正确文字，采用所述正确文字替换所述错别字，得到所述待处理文本的纠错文本。/n

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司，未经北京百度网讯科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201911000662.8/，转载请声明来源钻瓜专利网。

上一篇：一种答题卡生成方法、识别方法、装置及存储介质
下一篇：手持式读取器

同类专利

专利分类

G 物理

G06 计算；推算；计数

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]文本信息处理方法及装置有效

专利文献下载