[发明专利]字符串相似度的确定方法、装置、存储介质及电子设备在审
申请号: | 202210456248.3 | 申请日: | 2022-04-27 |
公开(公告)号: | CN114943966A | 公开(公告)日: | 2022-08-26 |
发明(设计)人: | 高爽笑;李飞;武春杰;荣刚 | 申请(专利权)人: | 联宝(合肥)电子科技有限公司 |
主分类号: | G06V30/12 | 分类号: | G06V30/12;G06V30/19 |
代理公司: | 北京乐知新创知识产权代理事务所(普通合伙) 11734 | 代理人: | 江宇 |
地址: | 230601 安徽省合肥市经济技*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字符串 相似 确定 方法 装置 存储 介质 电子设备 | ||
1.一种字符串相似度的确定方法,其特征在于,该方法包括:
获取识别字符串和目标字符串,并确定所述识别字符串的长度和所述目标字符串的长度;
若所述识别字符串需要变换操作转换为所述目标字符串,则根据所述变换操作的最少变换步数和所述变换操作的权重确定所述识别字符串与所述目标字符串的编辑距离;所述变换操作包括插入、删除、替换中的一种或多种;
根据所述识别字符串的长度、所述目标字符串的长度、所述编辑距离,确定所述识别字符串与所述目标字符串的相似度。
2.根据权利要求1所述的方法,其特征在于,所述替换操作的权重大于所述插入操作的权重和所述删除操作的权重。
3.根据权利要求1或2所述的方法,其特征在于,若所述识别字符串的长度大于所述目标字符串的长度,则所述变换操作至少包括删除,根据所述识别字符串的长度和所述目标字符串的长度确定所述删除操作的权重。
4.根据权利要求3所述的方法,其特征在于,所述根据所述变换操作的最少变换步数和所述变换操作的权重确定所述识别字符串与所述目标字符串的编辑距离,包括:
确定由所述识别字符串变换为所述目标字符串的最少变换操作,并确定每个变换操作的变换步数;
根据所述变换步数和所述变换操作对应的权重,确定每个变换操作的变换距离;
将所有变换操作对应的变换距离之和,确定为所述述识别字符串与所述目标字符串的编辑距离。
5.根据权利要求4所述的方法,其特征在于,所述确定所述识别字符串与所述目标字符串的相似度,包括:
根据所述识别字符串的长度和所述目标字符串的长度,确定所述识别字符串和所述目标字符串的总长度;
根据所述总长度和所述编辑距离,确定所述总长度和所述编辑距离的差值;
将所述差值和所述总长度的比值确定为相似度。
6.一种字符串相似度的确定装置,其特征在于,该装置包括:
获取模块,用于获取识别字符串和目标字符串,并确定所述识别字符串的长度和所述目标字符串的长度;
编辑距离确定模块,用于若所述识别字符串需要变换操作转换为所述目标字符串,则根据所述变换操作的最少变换步数和所述变换操作的权重确定所述识别字符串与所述目标字符串的编辑距离;所述变换操作包括插入、删除、替换中的一种或多种,且不同变换操作的权重不同;
相似度确定模块,用于根据所述识别字符串的长度、所述目标字符串的长度、所述编辑距离,确定所述识别字符串与所述目标字符串的相似度。
7.根据权利要求6所述的装置,其特征在于,所述编辑距离确定模块,包括:
第一确定单元,用于确定由所述识别字符串变换为所述目标字符串的最少变换操作,并确定每个变换操作的变换步数;
第二确定单元,用于根据所述变换步数和所述变换操作对应的权重,确定每个变换操作的变换距离;
第三确定单元,用于将所有变换操作对应的变换距离之和,确定为所述述识别字符串与所述目标字符串的编辑距离。
8.根据权利要求6所述的装置,其特征在于,所述相似度确定模块,包括:
总长度确定单元,用于根据所述识别字符串的长度和所述目标字符串的长度,确定所述识别字符串和所述目标字符串的总长度;
差值确定单元,用于根据所述总长度和所述编辑距离,确定所述总长度和所述编辑距离的差值;
相似度确定单元,用于将所述差值和所述总长度的比值确定为相似度。
9.一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1-5任一项所述的字符串相似度的确定方法。
10.一种电子设备,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述权利要求1-5任一项所述的字符串相似度的确定方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联宝(合肥)电子科技有限公司,未经联宝(合肥)电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210456248.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高温热风蝶阀
- 下一篇:一种融合主题标签和用户偏好的课程推荐系统及方法