[发明专利]地理编码实现方法和装置有效
申请号: | 201310706024.4 | 申请日: | 2013-12-19 |
公开(公告)号: | CN103699623B | 公开(公告)日: | 2017-07-04 |
发明(设计)人: | 余晓龙 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京品源专利代理有限公司11332 | 代理人: | 胡彬 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 地理 编码 实现 方法 装置 | ||
1.一种地理编码实现方法,其特征在于,包括:
对地址信息进行拆分和语义解析,以获取至少两个子地址对应的信息点数据,包括:对所述地址信息进行语义解析,以获得具有独立地址语义的短语;基于信息点数据库中的地理编码规范关键词和关联区域关键词,对短语进行信息点识别,与信息点匹配的短语作为基础单元,与信息点不匹配的短语作为附加单元;将基础单元,或所述基础单元和后续的附加单元,合并为一个子地址信息;采用偏移量关键词对所述子地址信息的附加单元进行识别,以确定所述子地址信息为精确子地址、模糊子地址或偏移子地址的信息点数据;模糊子地址和偏移子地址用于对精确子地址进行辅助定位;
根据获取的至少两个信息点数据,对所述地址信息对应的地理目标进行地理编码。
2.根据权利要求1所述的方法,其特征在于,对所述地址信息进行语义解析,以获得具有独立地址语义的短语包括:
基于分词数据库将地址信息进行分词处理,获得具有独立语义的词语;
将词语进行合并处理,获得具有独立地址语义的短语。
3.根据权利要求1所述的方法,其特征在于,采用偏移量关键词对所述子地址信息的附加单元进行识别,以确定所述子地址信息为精确子地址、模糊子地址或偏移子地址的信息点数据包括:
采用偏移量关键词对所述子地址信息的附加单元进行识别;
如果所述子地址信息不包括附加单元,则确定所述子地址信息对应于精确子地址的信息点数据;
如果所述子地址信息包括附加单元,且所述附加单元中包括偏移量,则根据所述子地址信息的基础单元,以及所述附加单元中识别到的偏移量关键词和偏移量,确定所述子地址信息为偏移子地址的信息点数据;
如果所述子地址信息包括附加单元,且所述附加单元中不包括偏移量,则根据所述子地址信息的基础单元,以及所述附加单元中识别到的偏移量关键词,确定所述子地址信息为模糊子地址的信息点数据。
4.根据权利要求1所述的方法,其特征在于,基于信息点数据库中的地理编码规范关键词和关联区域关键词,对短语进行信息点识别包括:
如果识别到与信息点数据库中的关联区域关键词匹配的短语时,根据所述关联区域关键词,基于信息点数据库中的地理编码规范关键词对当前短语的前序短语进行识别,以获取至少两个关联信息点;
根据至少两个关联信息点和关联区域关键词获取关联区域信息点。
5.根据权利要求1所述的方法,其特征在于,根据获取的至少两个信息点数据,对所述地址信息对应的地理目标进行地理编码包括:
将精确子地址、模糊子地址和/或偏移子地址的信息点数据按照预设层级存储为地址树;和/或
根据精确子地址的信息点数据进行地理编码,且根据所述模糊子地址和/或偏移子地址的信息点数据对地理编码进行修正或校验;和/或
如果根据精确子地址的信息点数据在数据库中匹配至少两个信息点时,根据所述模糊子地址和/或偏移子地址的信息点数据在所述至少两个信息点中进行选择。
6.一种地理编码实现装置,其特征在于,包括:
地址信息处理模块,用于对地址信息进行拆分和语义解析,以获取至少两个子地址对应的信息点数据,包括:短语获取单元,用于对所述地址信息进行语义解析,以获得具有独立地址语义的短语;短语匹配单元,用于基于信息点数据库中的地理编码规范关键词和关联区域关键词,对短语进行信息点识别,与信息点匹配的短语作为基础单元,与信息点不匹配的短语作为附加单元;子地址合并单元,用于将基础单元,或所述基础单元和后续的附加单元,合并为一个子地址信息;子地址识别单元,用于采用偏移量关键词对所述子地址信息的附加单元进行识别,以确定所述子地址信息为精确子地址、模糊子地址或偏移子地址的信息点数据;模糊子地址和偏移子地址用于对精确子地址进行辅助定位;
地理编码模块,用于根据获取的至少两个信息点数据,对所述地址信息对应的地理目标进行地理编码。
7.根据权利要求6所述的装置,其特征在于,短语获取单元具体用于:
基于分词数据库将地址信息进行分词处理,获得具有独立语义的词语;
将词语进行合并处理,获得具有独立地址语义的短语。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310706024.4/1.html,转载请声明来源钻瓜专利网。