[发明专利]形近字确定方法、装置、计算机设备和存储介质有效
申请号: | 201910359360.3 | 申请日: | 2019-04-30 |
公开(公告)号: | CN110097002B | 公开(公告)日: | 2020-12-11 |
发明(设计)人: | 刘春 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 祝亚男 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 形近字 确定 方法 装置 计算机 设备 存储 介质 | ||
1.一种形近字确定方法,其特征在于,包括:
获取第一字符和第二字符;
获取所述第一字符的第一结构特征和所述第二字符的第二结构特征;
根据所述第一结构特征和所述第二结构特征,确定所述第一字符和所述第二字符之间的结构相似度;
基于所述第一字符的第一字符图像和所述第二字符的第二字符图像,确定所述第一字符和所述第二字符之间的图像相似度,其中,所述基于所述第一字符的第一字符图像和所述第二字符的第二字符图像,确定所述第一字符和所述第二字符之间的图像相似度包括:获取所述第一字符的第一字符图像和所述第二字符的第二字符图像,所述第一字符图像和所述第二字符图像分别用于表示所述第一字符和所述第二字符的屏幕显示样式,所述屏幕显示样式是指字符在不同系统的设备屏幕上的显示形态,根据所述第一字符图像和所述第二字符图像,确定所述第一字符和所述第二字符之间的图像相似度;
根据所述结构相似度和所述图像相似度,通过公式确定所述第一字符和所述第二字符之间的相似度,所述公式为:
其中,s为所述第一字符和所述第二字符之间的相似度,s1为所述结构相似度,s2为所述图像相似度;
根据所述第一字符和所述第二字符之间的相似度,获取所述第一字符和所述第二字符的形近字确定结果,所述形近字确定结果用于指示所述第一字符和所述第二字符是否为形近字。
2.根据权利要求1所述的形近字确定方法,其特征在于,字符的结构特征包括字符的笔画、笔画顺序、结构类型和四角编码,所述获取所述第一字符的第一结构特征和所述第二字符的第二结构特征包括:
分别根据所述第一字符的字符标识和所述第二字符的字符标识,从字符信息库中查询所述第一字符的存储地址和所述第二字符的存储地址;
从所述第一字符的存储地址中,获取所述第一字符的第一笔画、第一笔画顺序、第一结构类型和第一四角编码,从所述第二字符的存储地址中,获取所述第二字符的第二笔画、第二笔画顺序、第二结构类型和第二四角编码。
3.根据权利要求2所述的形近字确定方法,其特征在于,所述根据所述第一结构特征和所述第二结构特征,确定所述第一字符和所述第二字符之间的结构相似度包括:
根据所述第一笔画和所述第二笔画,分别统计所述第一字符的第一笔画数目和所述第二字符的第二笔画数目,根据所述第一笔画数目和所述第二笔画数目,确定所述第一字符和所述第二字符之间的笔画数目相似度;
根据所述第一笔画顺序和所述第二笔画顺序,确定所述第一字符和所述第二字符之间的笔画顺序相似度;
根据所述第一结构类型和所述第二结构类型,确定所述第一字符和第二字符之间的结构类型相似度;
根据所述第一四角编码和所述第二四角编码,确定所述第一字符和所述第二字符之间的四角编码相似度;
根据所述第一字符和第二字符之间的笔画数目相似度、笔画顺序相似度、结构类型相似度和四角编码相似度以及第一权重、第二权重、第三权重和第四权重,确定所述第一字符和所述第二字符之间的结构相似度;
所述第一权重为笔画数目相似度的权重,所述第二权重为笔画顺序相似度的权重,所述第三权重为结构类型相似度的权重,所述第四权重为四角编码相似度的权重。
4.根据权利要求3所述的形近字确定方法,其特征在于,所述根据所述第一笔画顺序和所述第二笔画顺序,确定所述第一字符和所述第二字符之间的笔画顺序相似度包括:
根据所述第一笔画顺序包括的多个笔画顺序编码和所述第二笔画顺序包括的多个笔画顺序编码,确定所述第一字符和所述第二字符之间的笔画顺序编辑距离,所述笔画顺序编辑距离是指通过对所述第一字符的笔画进行编辑操作变换为所述第二字符所需要的最小操作单位数;
根据所述第一字符和所述第二字符之间的笔画顺序编辑距离、所述第一字符的第一笔画数目和所述第二字符的第二笔画数目,确定所述第一字符和所述第二字符之间的笔画顺序相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910359360.3/1.html,转载请声明来源钻瓜专利网。