[发明专利]文本模型训练方法、文本纠错方法、电子设备及存储介质有效
申请号: | 201911419034.3 | 申请日: | 2019-12-31 |
公开(公告)号: | CN111209740B | 公开(公告)日: | 2023-08-15 |
发明(设计)人: | 郭晗暄;单彦会;李程坤;郑文彬;罗红 | 申请(专利权)人: | 中移(杭州)信息技术有限公司;中国移动通信集团有限公司 |
主分类号: | G06F40/232 | 分类号: | G06F40/232;G06F40/289;G06N3/044;G06N3/0442;G06N3/08 |
代理公司: | 上海晨皓知识产权代理事务所(普通合伙) 31260 | 代理人: | 成丽杰 |
地址: | 310011 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例涉及深度学习领域,公开了文本模型训练方法、文本纠错方法、电子设备及存储介质。本发明中,将语音对话进行文本转换,得到错误文本,对错误文本进行纠错,得到正确文本,根据热词表对错误文本以及正确文本进行分词;之后对分词后的文本样本进行编码得到的文本训练样本,将文本输入样本输入至深度神经网络中进行训练,得到目标文本模型。相对于现有技术基于规则的模型或者基于统计的模型进行文本纠错而言,分词精确度更高,提高了模型训练得到的目标文本模型的纠错准确率。另外,基于建立的目标文本模型进行纠错,在纠错过程中仅需输入错误句子即可得到正确句子,减少了纠错过程中的工作量以及成本。 | ||
搜索关键词: | 文本 模型 训练 方法 纠错 电子设备 存储 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中移(杭州)信息技术有限公司;中国移动通信集团有限公司,未经中移(杭州)信息技术有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201911419034.3/,转载请声明来源钻瓜专利网。