[发明专利]一种适用于特定垂直领域的文本纠错方法及其纠错装置在审
申请号: | 202110687769.5 | 申请日: | 2021-06-21 |
公开(公告)号: | CN113449514A | 公开(公告)日: | 2021-09-28 |
发明(设计)人: | 励建科;陈再蝶;朱晓秋;周杰;樊伟东 | 申请(专利权)人: | 浙江康旭科技有限公司 |
主分类号: | G06F40/232 | 分类号: | G06F40/232;G06F40/284;G06F40/30 |
代理公司: | 杭州山泰专利代理事务所(普通合伙) 33438 | 代理人: | 周玲 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种适用于特定垂直领域的文本纠错方法及其纠错装置,包括以下步骤:S1、将文本导入经过预训练的Bert纠错模型中,进行文本词义纠错;S2、将经过Bert纠错模型纠错后的文本导入拼音纠错模型中,进行二次纠错;S3、将经过拼音纠错模型进行二次纠错后的文本导入热词替换规则模型中,进行第三次纠错。本发明中,将用户输入的文本先倒入Bert纠错模型进行文本纠错,再将修正过一次的文本导入拼音纠错模型进行二次纠错,从而在对文本进行语义修正后,针对垂直领域的专有名词进行修正以达到加强效果,提高了文本纠错的准确率,之后再将二次纠错后的文本倒入热词替换规则模型进行热词替换,将方言等口语化文本转换为专有名词,再次增强纠错效果。 | ||
搜索关键词: | 一种 适用于 特定 垂直 领域 文本 纠错 方法 及其 装置 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江康旭科技有限公司,未经浙江康旭科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110687769.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种印刷机
- 下一篇:一种基于深度学习的轻型活体检测方法