[发明专利]一种基于语义识别的地址匹配方法在审

专利信息
申请号: 201310596806.7 申请日: 2013-11-21
公开(公告)号: CN103605752A 公开(公告)日: 2014-02-26
发明(设计)人: 黄俊韬;魏延峰;吴杰;赵雷雷;刘琳;刘勇;肖豪;邓跃进;宋爱红;范业稳;朱伟奇;张龙;陈胜鹏;程方;贺楷锴;许振华 申请(专利权)人: 武大吉奥信息技术有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京天奇智新知识产权代理有限公司 11340 代理人: 刘黎明
地址: 湖北省武汉市东湖开*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 语义 识别 地址 匹配 方法
【说明书】:

技术领域

发明属于对地观测与导航技术领域,具体涉及一种基于语义识别的地址匹配方法。

背景技术

地址检索、查询服务是网络地图在线服务的重要功能。地址匹配是将文字性的描述地址与其空间的地理位置坐标建立起对应关系的过程,其目的是要根据用户输入的待检索地址快速查找到匹配的地址,并以在线服务的形式返回用户检索结果。传统的方法通常采用基于关键词的精确或模糊匹配方法,这对于大规模或大范围的地名地址数据,不仅查找的速度慢,很难满足网络地图在线快速服务的需要,也没有顾及地址的语义信息,导致查找的准确性比较低,查找结果多样且往往不是用户所需要的结果。例如,当用户在互联网上查找“上海南京路”时,期望的返回结果应该是位于上海,名称为南京路的道路,但普通的查找方法可能会将南京的上海路和上海的南京路都作为结果返回。因此,针对上述两个问题,发明了一种基于语义识别的地址匹配方法,可以有效地提高地址数据查找的速度和准确性,从而提高网络地图在线服务质量,为用户提供良好的服务检验。

发明内容

针对上述现有技术中的不足,本发明的目的在于提供一种基于语义识别的地址匹配方法。对于以自然语言形式表示的地址信息,通过中文分词技术,并顾及地址的语义建立用于地址匹配的语义库或知识库,然后根据地址数据表达的语义特点,建立地址匹配的规则,通过适当的匹配算法提高地址检索的速度和准确性。

为了实现上述发明目的,本申请提供了以下技术方案:

一种基于语义识别的地址匹配方法,所述方法包括地址匹配引擎和日志分析引擎,所述地址匹配引擎根据用户输入的待检索地址基于语义识别快速、准确地查找到匹配的地址,并以在线服务的形式返回用户检索结果,所述日志分析引擎记录并分析查询日志,根据日志分析结果优化地址匹配引擎。地址匹配引擎包括行政区划语义模块、地名类别语义模块、语义规则模块、标准地址模块、语义规则模块、中文分词模块、语义识别模块、查询模块。所述方法步骤如下:

(1)利用行政区划语义模块建立行政区划语义库;

(2)利用地名类别语义模块建立地名类别语义库;

(3)利用标准地址模块建立规范化的具体地址库;

(4)利用语义规则模块建立基于语义的地址检索规则;

(5)利用中文分词模块对待查地址进入中文分词;

(6)利用语义识别模块对分词得到的词元进行语义识别;

(7)利用查询模块对识别后的词元基于语义规则进行查询;

(8)利用日志分析引擎记录地址匹配日志,分析日志,将分析结果反馈给地址匹配引擎,优化地址匹配引擎。

在步骤(1)中,所述行政区划语义模块中,行政区划以其国家标准编码为基本信息,建立相应的行政区划语义库,用于地址匹配后续过程的行政区划语义匹配,行政区划是界定地址行政范围的主要属性之一,也是地址的基本语义之一,在进行地址匹配时,行政区划语义是优先考虑的语义匹配。

在步骤(2)中,所述地名类别语义模块,描述了地名地址所归属的分类,是地址的基本语义之一,其中,地名类别编码是多级编码的方式。

步骤(3)中,所述标准地址模块对不同区域的地址数据进行规范化设计,准确地进行地址匹配。

在步骤(4)中,所述语义规则模块,建立基于语义的地址检索规则和规则间的关系,形成地址检索的知识库,具体方法为

a、当词元有且仅有一个,并且该词元类型为“行政区划”时,进行行政区划查询,返回行政区划的信息;

b、当词元有多个且所有词元都是“行政区划”时,进行行政区划查询,返回地区级别最小的那个行政区划信息;

c、当词元有多个且所有词元都是“行政区划”时,并且行政区划不是上下级关系,应取第一个行政区划做范围,其他行政区划做关键字进行普通地名查询,返回位置在行政区划内,且名称包含指定关键字的地名;

d、当词元有且仅有一个,并且该词元类型为“类别”时,按照类别进行查询;

e、当词元中既有“类别”,也有“行政区划”的时候,按照规则c得到行政区划和关键字,在指定类别中查找地名;

f、当词元既不包含“行政区划”类的词,也不包含“类别”类的词,将这些词当做关键字查找地名;

g、当词元既包含“行政区划”类的词,同时包含关键字,则在行政区划内按指定关键字进行查询;

h、当词元既包含多个“行政区划”类的词,并且行政区划不是同一区域,或者是第二个行政区划大于第一行政区划,包含关键字,第一个当行政区划,后面当做关键字处理;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武大吉奥信息技术有限公司,未经武大吉奥信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310596806.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top