[发明专利]用于确定网页页面中包括兴趣点POI数据的方法及装置有效
申请号: | 201510148638.4 | 申请日: | 2015-03-31 |
公开(公告)号: | CN104699835A | 公开(公告)日: | 2015-06-10 |
发明(设计)人: | 王智广;魏少俊 | 申请(专利权)人: | 北京奇虎科技有限公司;奇智软件(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市立方律师事务所 11330 | 代理人: | 王增鑫 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了用于确定网页页面中包括兴趣点POI数据的方法及装置,包括:从互联网中获取多个POI数据;爬取包括地址信息的多个网页页面;将多个POI数据中的地址信息及多个网页页面包含的地址信息分别归一化为经纬度信息;在多个POI数据的经纬度信息与多个网页页面中经纬度信息中进行匹配;对于具有相同经纬度信息的POI数据及网页页面,根据该POI数据对应的POI名称在该网页页面中进行查找,确定该网页页面中是否包括该POI数据的POI名称;当该网页页面中包括该POI数据的POI名称时,确定该网页页面包括该兴趣点POI数据。本发明有利于后续根据网页页面所记载内容的准确性,来确定收集到的POI数据的准确性,为后续为大批量地收集互联网中准确POI数据提供可靠保证。 | ||
搜索关键词: | 用于 确定 网页 页面 包括 兴趣 poi 数据 方法 装置 | ||
【主权项】:
一种用于确定网页页面中包括兴趣点POI数据的方法,其特征在于,包括:从互联网中获取多个POI数据;爬取包括地址信息的多个网页页面;将所述多个POI数据中的地址信息及所述多个网页页面包含的地址信息分别归一化为经纬度信息;基于同一经纬度信息,在所述多个POI数据的经纬度信息与多个网页页面中经纬度信息中进行匹配;对于具有相同经纬度信息的POI数据及网页页面,根据该POI数据对应的POI名称在该网页页面中进行查找,确定该网页页面中是否包括该POI数据的POI名称;当该网页页面中包括该POI数据的POI名称时,确定该网页页面包括该兴趣点POI数据。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司;奇智软件(北京)有限公司;,未经北京奇虎科技有限公司;奇智软件(北京)有限公司;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510148638.4/,转载请声明来源钻瓜专利网。