[发明专利]地址对比方法、装置及系统有效
申请号: | 201910080631.1 | 申请日: | 2019-01-28 |
公开(公告)号: | CN109739997B | 公开(公告)日: | 2021-03-23 |
发明(设计)人: | 王征 | 申请(专利权)人: | 致诚阿福技术发展(北京)有限公司;普信恒业科技发展(北京)有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06K9/62 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 巴翠昆;王宝筠 |
地址: | 100026 北京市朝阳区西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 地址 对比 方法 装置 系统 | ||
1.一种地址对比方法,其特征在于,包括:
获取第一地址;
利用预设行政区划知识图谱对所述第一地址执行标准化操作,获得第一标准地址;
对比所述第一标准地址和预设的第二标准地址,获得对比结果;
其中,所述利用预设行政区划知识图谱对所述第一地址执行标准化操作获得第一标准地址,包括:
利用地址分词技术对所述第一地址执行分词操作,获得所述第一地址的多个分词结果,每个分词结果作为一实体;
从所述分词结果中确定五级行政区划的第一实体集,以及,其余实体组成的第二实体集;
于所述预设行政区划知识图谱中搜索所述第一实体集中的各个实体;
判断第一实体集中搜索到的实体是否于所述预设行政区划知识图谱中具有唯一子图;其中,所述预设行政区划知识图谱中搜索到的实体组成的链路为子图;
若是,则利用所述唯一子图补全所述第一地址,获得第一标准地址;
若否,则利用所述第一实体集和所述第二实体集,于所述预设行政区划知识图谱中搜索所述第一实体集和所述第二实体集中的各个实体;
判断第二实体集中搜索到的实体是否于所述预设行政区划知识图谱中具有唯一子图;
若是,则利用所述唯一子图补全所述第一地址,获得第一标准地址;
若否,则确定无法利用预设行政区划知识图谱对所述第一地址执行标准化操作。
2.如权利要求1所述的方法,其特征在于,在对比所述第一标准地址和预设的第二标准地址获得对比结果之前,还包括:
获取第二地址;
利用所述预设行政区划知识图谱对所述第二地址执行标准化操作,获得所述第二标准地址。
3.如权利要求1或2所述的方法,其特征在于,所述预设行政区划知识图谱的构建过程包括:
依据五级行政区划数据构建基础知识图谱,其中每个行政区划为一实体;
于互联网中搜索五级行政区划的多个下属条目;
按所属关系添加多个下属条目至所述基础知识图谱;其中每个下属条目为一实体;
向所述基础知识图谱中添加实体的近似实体,获得行政区划知识图谱。
4.如权利要求3所述的方法,其特征在于,所述向所述基础知识图谱中添加实体的近似实体,获得行政区划知识图谱,包括:
对于所述基础知识图谱中第四级实体和第五级实体中每个实体而言:
获取实体的一个或多个近似实体;
添加一个或多个近似实体至该实体。
5.如权利要求4所述的方法,其特征在于,所述获取实体的一个或多个近似实体包括:
获取该实体的一个或多个模糊音实体;
获取该实体的一个或多个形近字实体。
6.如权利要求1所述的方法,其特征在于,在确定无法利用预设行政区划知识图谱对所述第一地址执行标准化操作之后,还包括:
于互联网采用模糊匹配机制搜索所述第一地址的多个近似地址;
于所述多个近似地址中确定与所述第一地址编辑距离最近的近似地址;
将所述近似地址作为第一地址,继续执行地址标准化操作。
7.如权利要求3所述的方法,其特征在于,还包括:
在检测到行政区划数据或五级行政区划的下属条目发生变化,则更新预设行政区划知识图谱。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于致诚阿福技术发展(北京)有限公司;普信恒业科技发展(北京)有限公司,未经致诚阿福技术发展(北京)有限公司;普信恒业科技发展(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910080631.1/1.html,转载请声明来源钻瓜专利网。