[发明专利]基于汉字音形相似性的拼写纠错方法、装置以及电子设备有效
申请号: | 202110460497.5 | 申请日: | 2021-04-27 |
公开(公告)号: | CN112883718B | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 林金曙;娄东方;王炯亮;陈哲;陈春旭 | 申请(专利权)人: | 恒生电子股份有限公司 |
主分类号: | G06F40/232 | 分类号: | G06F40/232;G06F40/242;G06K9/62 |
代理公司: | 杭州华鼎知识产权代理事务所(普通合伙) 33217 | 代理人: | 魏亮 |
地址: | 310051 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请实施例提出了基于汉字音形相似性的拼写纠错方法、装置以及电子设备,包括根据标准汉字数据库构建包含汉字音形信息的样本汉字集合;基于样本汉字集合中的汉字转换成本计算任意两个汉字之间对应汉字音形信息的相似度,根据得到的相似度结果构建对应样本汉字集合中每个汉字的相似汉字集合;获取与目标汉字相关联的候选词,结合目标汉字与候选词的相似度与阈值的数值关系筛选得到对目标汉字进行纠错后的替换汉字。由于汉字转换成本计算只发生在音形编辑初始过程中,具体过程中不涉及层级间的计算,只需从预先加载的汉字与词典的映射字典取出即可;能够有效降低BK树中文纠错算法从树顶层往下不断对比带来的庞大计算量,提升纠错效率。 | ||
搜索关键词: | 基于 汉字 形相 拼写 纠错 方法 装置 以及 电子设备 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于恒生电子股份有限公司,未经恒生电子股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110460497.5/,转载请声明来源钻瓜专利网。
- 上一篇:车载终端共享数据方法及装置
- 下一篇:电解液及锂离子电池