[发明专利]文本纠错方法、电子设备及计算机可读存储介质在审
申请号: | 202111012472.5 | 申请日: | 2021-08-31 |
公开(公告)号: | CN113743094A | 公开(公告)日: | 2021-12-03 |
发明(设计)人: | 张浩波 | 申请(专利权)人: | 上海携宁计算机科技股份有限公司 |
主分类号: | G06F40/232 | 分类号: | G06F40/232;G06F40/289;G06F40/242;G06F16/33;G06F16/31 |
代理公司: | 上海晨皓知识产权代理事务所(普通合伙) 31260 | 代理人: | 成丽杰 |
地址: | 200030 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请实施例涉及计算机技术领域,公开了一种文本纠错方法、电子设备及计算机可读存储介质。对待纠错词汇按字粒度进行切分,得到若干检索片段;其中,检索片段的类型为单个字母或汉字拼音;在预设的索引词元集合中,确定与检索片段一致的目标索引词元;其中,索引词元集合中的索引词元的类型包括单个字母和汉字拼音;根据目标索引词元在预设的索引中进行检索,得到和目标索引词元顺序一致的若干专有名词作为候选词;根据待纠错词汇的字频和候选词的字频计算编辑距离,对候选词打分,得到候选词对应的分数;将分数最高的候选词作为纠错结果,替换待纠错词汇,可以显著降低文本纠错的成本,大幅提升文本纠错的准确度,同时提升文本纠错的精度。 | ||
搜索关键词: | 文本 纠错 方法 电子设备 计算机 可读 存储 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海携宁计算机科技股份有限公司,未经上海携宁计算机科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202111012472.5/,转载请声明来源钻瓜专利网。