[发明专利]地址相似性的检测方法和装置在审
申请号: | 201911080703.9 | 申请日: | 2019-11-07 |
公开(公告)号: | CN111767936A | 公开(公告)日: | 2020-10-13 |
发明(设计)人: | 李慧萍 | 申请(专利权)人: | 北京沃东天骏信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/29;G06Q30/06 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 王明磊;臧建明 |
地址: | 100076 北京市经济技术开*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 地址 相似性 检测 方法 装置 | ||
本发明提供一种地址相似性的检测方法和装置,其中,地址相似性的检测方法包括:获取待比对的第一地址和第二地址;分别对第一地址和第二地址按字分割,获得字符集合、第一向量和第二向量;其中,字符集合包括第一地址和第二地址按字分割后的所有字符,第一向量包括字符集合中的每个字符在第一地址中出现的频次,第二向量包括字符集合中的每个字符在第二地址中出现的频次;根据第一向量和第二向量获取第一地址与第二地址的相似度。通过地址中字符出现的频次构成的向量获得地址之间的相似性,提升了地址相似性匹配的准确性。
技术领域
本发明涉及数据处理技术领域,尤其涉及一种地址相似性的检测方法和装置。
背景技术
随着智能终端与物联网技术的发展,越来越多的用户选择通过电商平台进行购物。
在实际的业务场景中,经常需要对订单中的地址进行风险验证。目前,常用的检测方法为:根据长度为N的滑动窗口滑动获取订单地址中的字节片段,将字节片段与预设词库中的关键词进行比对,完成地址的风险验证。
但是,在进行关键词比对时,需要字节片段与关键词中的每个字完全匹配上,导致地址相似性匹配的准确率较低。
发明内容
本发明提供一种地址相似性的检测方法和装置,提升了地址相似性匹配的准确性。
第一方面,本发明提供一种地址相似性的检测方法,包括:
获取待比对的第一地址和第二地址;
分别对所述第一地址和所述第二地址按字分割,获得字符集合、第一向量和第二向量;其中,所述字符集合包括所述第一地址和所述第二地址按字分割后的所有字符,所述第一向量包括所述字符集合中的每个字符在所述第一地址中出现的频次,所述第二向量包括所述字符集合中的每个字符在所述第二地址中出现的频次;
根据所述第一向量和所述第二向量获取所述第一地址与所述第二地址的相似度。
可选的,所述获取待比对的第一地址和第二地址,包括:
获取所述第一地址以及所述第一地址的检测场景;
根据所述第一地址的检测场景获取所述第二地址。
可选的,若所述检测场景为确定所述第一地址是否为用户的常用地址,则所述第二地址包括所述用户的常用地址;
若所述检测场景为确定所述第一地址是否为非法地址,则所述第二地址包括预设黑名单地址库中的地址。
可选的,获取第一地址,包括:
获取待检测的地址,所述待检测的地址包括分级地址和非分级地址;
对所述待检测的地址进行处理以删除所述分级地址,获得所述第一地址。
可选的,所述第二地址包括非分级地址且不包括分级地址。
可选的,所述根据所述第一向量和所述第二向量获取所述第一地址与所述第二地址的相似度,包括:
根据所述第一向量和所述第二向量获取所述第一向量与所述第二向量的余弦相似度,并将所述余弦相似度确定为所述第一地址与所述第二地址的相似度;或者,
根据所述第一向量和所述第二向量获取所述第一向量与所述第二向量之间的距离,并将所述距离确定为所述第一地址与所述第二地址的相似度。
可选的,所述第一地址对应的分级地址与所述第二地址对应的分级地址相同。
第二方面,本发明提供一种地址相似性的检测装置,包括:
获取模块,用于获取待比对的第一地址和第二地址;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃东天骏信息技术有限公司,未经北京沃东天骏信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911080703.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:图像形成设备
- 下一篇:一种带有旋转结构的烧烤炉及其烧烤方法