[发明专利]文本纠错方法、装置、电子设备以及存储介质有效
申请号: | 202011548334.4 | 申请日: | 2020-12-24 |
公开(公告)号: | CN112580324B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 徐梦笛;赖佳伟;邓卓彬;付志宏 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F40/194 | 分类号: | G06F40/194 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 韩海花 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 纠错 方法 装置 电子设备 以及 存储 介质 | ||
本公开公开了文本纠错方法、装置、电子设备以及存储介质,涉及计算机技术领域,尤其涉及深度学习、自然语言处理等人工智能技术领域。具体实现方案为:获取待处理的文本,以及所述文本所属的目标场景;获取所述目标场景下的词语替换表,并结合所述目标场景下的词语替换表,获取所述文本中的各个错误词语,以及每个错误词语对应的候选词语列表;从所述各个错误词语对应的候选词语列表中,选择所述各个错误词语对应的待替换词语;结合所述各个错误词语对应的待替换词语,对所述文本进行纠错处理,得到纠错后文本。由此,实现了基于目标场景下的词语替换表,对目标场景下的文本进行纠错,提高了目标场景下的文本纠错准确率。
技术领域
本公开涉及计算机技术领域,特别涉及深度学习、自然语言处理等人工智能技术领域,尤其涉及文本纠错方法、装置、电子设备以及存储介质。
背景技术
文本纠错是自然语言处理领域中的一个重要研究方向,通过对文本进行纠错,可以纠正文本中人为因素产生的错误,比如,谐音字词错误,形似字错误,词语误用等。
相关技术中,通常采用通用的纠错模型,进行特定场景下文本的纠错,由于通用的纠错模型是采用大量的多个业务场景下的正确文本以及对应的错误文本进行训练得到的,因此在特定场景下的纠错准确率低。
发明内容
本公开提供了一种文本纠错方法、装置、电子设备、存储介质以及计算机程序产品。
根据本公开的一方面,提供了一种文本纠错方法,包括:获取待处理的文本,以及所述文本所属的目标场景;获取所述目标场景下的词语替换表,并结合所述目标场景下的词语替换表,获取所述文本中的各个错误词语,以及每个错误词语对应的候选词语列表;从所述各个错误词语对应的候选词语列表中,选择所述各个错误词语对应的待替换词语;结合所述各个错误词语对应的待替换词语,对所述文本进行纠错处理,得到纠错后文本。
根据本公开的另一方面,提供了一种文本纠错装置,包括:第一获取模块,用于获取待处理的文本,以及所述文本所属的目标场景;第二获取模块,用于获取所述目标场景下的词语替换表,并结合所述目标场景下的词语替换表,获取所述文本中的各个错误词语,以及每个错误词语对应的候选词语列表;选择模块,用于从所述各个错误词语对应的候选词语列表中,选择所述各个错误词语对应的待替换词语;第一处理模块,用于结合所述各个错误词语对应的待替换词语,对所述文本进行纠错处理,得到纠错后文本。
根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的文本纠错方法。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如上所述的文本纠错方法。
根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据如上所述的文本纠错方法。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是根据本公开第一实施例的文本纠错方法的流程示意图;
图2是根据本公开第二实施例的文本纠错方法的流程示意图;
图3是根据本公开第三实施例的文本纠错方法的流程示意图;
图4是根据本公开第四实施例的文本纠错方法的流程示意图;
图5是根据本公开实施例提供的纠错模型的结构框图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011548334.4/2.html,转载请声明来源钻瓜专利网。