[发明专利]地址相似性的检测方法和装置在审
申请号: | 201911080703.9 | 申请日: | 2019-11-07 |
公开(公告)号: | CN111767936A | 公开(公告)日: | 2020-10-13 |
发明(设计)人: | 李慧萍 | 申请(专利权)人: | 北京沃东天骏信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/29;G06Q30/06 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 王明磊;臧建明 |
地址: | 100076 北京市经济技术开*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 地址 相似性 检测 方法 装置 | ||
1.一种地址相似性的检测方法,其特征在于,包括:
获取待比对的第一地址和第二地址;
分别对所述第一地址和所述第二地址按字分割,获得字符集合、第一向量和第二向量;其中,所述字符集合包括所述第一地址和所述第二地址按字分割后的所有字符,所述第一向量包括所述字符集合中的每个字符在所述第一地址中出现的频次,所述第二向量包括所述字符集合中的每个字符在所述第二地址中出现的频次;
根据所述第一向量和所述第二向量获取所述第一地址与所述第二地址的相似度。
2.根据权利要求1所述的方法,其特征在于,所述获取待比对的第一地址和第二地址,包括:
获取所述第一地址以及所述第一地址的检测场景;
根据所述第一地址的检测场景获取所述第二地址。
3.根据权利要求2所述的方法,其特征在于,
若所述检测场景为确定所述第一地址是否为用户的常用地址,则所述第二地址包括所述用户的常用地址;
若所述检测场景为确定所述第一地址是否为非法地址,则所述第二地址包括预设黑名单地址库中的地址。
4.根据权利要求1-3任一项所述的方法,其特征在于,获取第一地址,包括:
获取待检测的地址,所述待检测的地址包括分级地址和非分级地址;
对所述待检测的地址进行处理以删除所述分级地址,获得所述第一地址。
5.根据权利要求4所述的方法,其特征在于,所述第二地址包括非分级地址且不包括分级地址。
6.根据权利要求1-3任一项所述的方法,其特征在于,所述根据所述第一向量和所述第二向量获取所述第一地址与所述第二地址的相似度,包括:
根据所述第一向量和所述第二向量获取所述第一向量与所述第二向量的余弦相似度,并将所述余弦相似度确定为所述第一地址与所述第二地址的相似度;或者,
根据所述第一向量和所述第二向量获取所述第一向量与所述第二向量之间的距离,并将所述距离确定为所述第一地址与所述第二地址的相似度。
7.根据权利要求1-3任一项所述的方法,其特征在于,所述第一地址对应的分级地址与所述第二地址对应的分级地址相同。
8.一种地址相似性的检测装置,其特征在于,包括:
获取模块,用于获取待比对的第一地址和第二地址;
分字模块,用于分别对所述第一地址和所述第二地址按字分割,获得字符集合、第一向量和第二向量;其中,所述字符集合包括所述第一地址和所述第二地址按字分割后的所有字符,所述第一向量包括所述字符集合中的每个字符在所述第一地址中出现的频次,所述第二向量包括所述字符集合中的每个字符在所述第二地址中出现的频次;
比对模块,用于根据所述第一向量和所述第二向量获取所述第一地址与所述第二地址的相似度。
9.根据权利要求8所述的装置,其特征在于,所述获取模块具体用于:
获取所述第一地址以及所述第一地址的检测场景;
根据所述第一地址的检测场景获取所述第二地址。
10.根据权利要求9所述的装置,其特征在于,
若所述检测场景为确定所述第一地址是否为用户的常用地址,则所述第二地址包括所述用户的常用地址;
若所述检测场景为确定所述第一地址是否为非法地址,则所述第二地址包括预设黑名单地址库中的地址。
11.根据权利要求8-10任一项所述的装置,其特征在于,所述获取模块具体用于:
获取待检测的地址,所述待检测的地址包括分级地址和非分级地址;
对所述待检测的地址进行处理以删除所述分级地址,获得所述第一地址。
12.根据权利要求11所述的装置,其特征在于,所述第二地址包括非分级地址且不包括分级地址。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃东天骏信息技术有限公司,未经北京沃东天骏信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911080703.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:图像形成设备
- 下一篇:一种带有旋转结构的烧烤炉及其烧烤方法