[发明专利]语法纠错方法、装置、电子设备和存储介质在审
申请号: | 202011591170.3 | 申请日: | 2020-12-29 |
公开(公告)号: | CN112686030A | 公开(公告)日: | 2021-04-20 |
发明(设计)人: | 戴建新;汪洋;付瑞吉;王士进;魏思;胡国平 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G06F40/253 | 分类号: | G06F40/253;G06F40/211 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 程琛 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语法 纠错 方法 装置 电子设备 存储 介质 | ||
本发明提供一种语法纠错方法、装置、电子设备和存储介质,其中方法包括:对待纠错文本进行错误检测,得到错误文本片段;对错误文本片段进行错误纠正,得到错误文本片段对应的纠正文本片段;基于错误文本片段和纠正文本片段之间的交互向量,确定错误文本片段对应的错误类型;其中,交互向量用于表征错误文本片段和纠正文本片段之间的差异性特征和共性特征。本发明提供的语法纠错方法、装置、电子设备和存储介质,通过对待纠错文本进行错误检测和错误纠正,得到错误文本片段和纠正文本片段,并基于错误文本片段和纠正文本片段之间的交互向量,确定错误文本片段对应的错误类型,使得本发明实施例提供的语法纠错方法具备可解释性。
技术领域
本发明涉及自然语言处理技术领域,尤其涉及一种语法纠错方法、装置、电子设备和存储介质。
背景技术
语法纠错是指对语言文本中的语法错误进行检测并予以纠正,在语法学习、文本校对等领域得到了广泛应用。
然而,目前的语法纠错方法中,基于翻译机制的语法纠错方法仅能输出正确的纠错结果,但无法解释输入语句存在的语法错误。因此,亟需一种纠错结果具备可解释性的语法纠错方法。
发明内容
本发明提供一种语法纠错方法、装置、电子设备和存储介质,用以解决现有技术中语法纠错方法不具备可解释性的缺陷,实现可解释的语法纠错。
本发明提供一种语法纠错方法,包括:
对待纠错文本进行错误检测,得到错误文本片段;
对所述错误文本片段进行错误纠正,得到所述错误文本片段对应的纠正文本片段;
基于所述错误文本片段和所述纠正文本片段之间的交互向量,确定所述错误文本片段对应的错误类型;其中,所述交互向量用于表征所述错误文本片段和所述纠正文本片段之间的差异性特征和共性特征。
根据本发明提供的一种语法纠错方法,所述错误文本片段和所述纠正文本片段之间的交互向量是基于如下步骤确定的:
对所述错误文本片段的文本向量以及所述纠正文本片段的文本向量进行减交互,以及乘交互和/或加交互,得到所述交互向量。
根据本发明提供的一种语法纠错方法,所述基于所述错误文本片段和所述纠正文本片段之间的交互向量,确定所述错误文本片段对应的错误类型,包括:
基于所述错误文本片段和所述纠正文本片段之间的交互向量,以及所述错误文本片段的错误类型先验向量,确定所述错误文本片段对应的错误类型;
所述错误类型先验向量是基于预设的错误类型库中与错误纠正对相匹配的样本错误纠正对的错误类型确定的,所述错误纠正对由所述错误文本片段和所述纠正文本片段构成。
根据本发明提供的一种语法纠错方法,所述错误类型先验向量是基于如下步骤确定的:
将所述错误纠正对与所述错误类型库中的各样本错误纠正对进行匹配,将相匹配的样本错误纠正对的错误类型作为所述错误纠正对的先验错误类型;
基于所述先验错误类型及其在所述错误类型库中出现的频率,确定所述错误类型先验向量。
根据本发明提供的一种语法纠错方法,所述对待纠错文本进行错误检测,包括:
基于所述待纠错文本中每一分词的句法上下文向量,以及每一分词与当前分词之间的句法关联度,确定所述当前分词的句法结构向量;
基于每一分词的句法结构向量,对所述待纠错文本进行错误检测。
根据本发明提供的一种语法纠错方法,所述对所述错误文本片段进行错误纠正,包括:
基于所述错误文本片段中的上一纠错向量以及上一纠正分词的词向量,确定当前纠错向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011591170.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种超级活性炭的制备方法
- 下一篇:一种真三轴多簇压裂模拟试验装置