[发明专利]中文语法纠错方法及系统、存储介质及终端在审
申请号: | 202211234582.0 | 申请日: | 2022-10-10 |
公开(公告)号: | CN115455949A | 公开(公告)日: | 2022-12-09 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 上海蜜度信息技术有限公司 |
主分类号: | G06F40/253 | 分类号: | G06F40/253;G06F40/232;G06F40/30;G06F40/205 |
代理公司: | 上海光华专利事务所(普通合伙) 31219 | 代理人: | 徐秋平 |
地址: | 201204 上海市浦东新区中国上海浦*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 中文 语法 纠错 方法 系统 存储 介质 终端 | ||
1.一种中文语法纠错方法,其特征在于,包括以下步骤:
基于自编码网络模型获取中文输入文本的语义信息,基于所述语义信息生成所述中文输入文本的语法纠错文本;
基于语言模型对所述语法纠错文本进行合理性判断,以获取最终中文文本。
2.根据权利要求1所述的中文语法纠错方法,其特征在于,基于多层语义编码器获取中文输入文本的语义信息。
3. 根据权利要求2所述的中文语法纠错方法,其特征在于,所述语义编码器采用Transformer blocks模型。
4.根据权利要求1所述的中文语法纠错方法,其特征在于,基于所述语义信息生成所述中文输入文本的语法纠错文本包括以下步骤:
基于所述语义信息检测所述中文输入文本的语法错误;
基于所述语义信息和所述语法错误对所述中文输入文本进行纠正,获取语法纠错文本。
5.根据权利要求4所述的中文语法纠错方法,其特征在于,基于所述语义信息和所述语法错误对所述中文输入文本进行纠正,获取语法纠错文本包括以下步骤:
基于所述语义信息和所述语法错误,生成所述中文输入文本的每个文字的标签;其中,对于不存在语法错误的文字,标签设置为第一预设符号;对于存在语法错误的文字,根据所述语义信息需删除时,标签设置为第二预设符号;对于存在语法错误的文字,根据所述语义信息需在后面增加文字时,标签设置为第三预设符号和所增加的文字;
将所述中文输入文本的每个文字的标签依次映射为对应的文字,以获取所述语法纠错文本。
6.根据权利要求4所述的中文语法纠错方法,其特征在于,基于所述语义信息检测所述中文输入文本的语法错误时,采用语法错误检测深度学习模型;基于所述语义信息和所述语法错误对所述中文输入文本进行纠正,获取语法纠错文本时,采用语法纠正深度学习模型。
7.根据权利要求1所述的中文语法纠错方法,其特征在于,所述语言模型采用N-Gram语言模型、GPT语言模型、ELMO语言模型中的一种或多种组合。
8.一种中文语法纠错系统,其特征在于,包括纠错模块和判断模块;
所述纠错模块用于基于自编码网络模型获取中文输入文本的语义信息,基于所述语义信息生成所述中文输入文本的语法纠错文本;
所述判断模块用于基于语言模型对所述语法纠错文本进行合理性判断,以获取最终中文文本。
9.一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1至7中任一项所述的中文语法纠错方法。
10.一种中文语法纠错终端,其特征在于,包括:处理器及存储器;
所述存储器用于存储计算机程序;
所述处理器用于执行所述存储器存储的计算机程序,以使所述中文语法纠错终端执行权利要求1至7中任一项所述的中文语法纠错方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海蜜度信息技术有限公司,未经上海蜜度信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211234582.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:具有感应加热器的洗衣装置及其控制方法
- 下一篇:一种食用菌加工用除杂筛选机