[发明专利]用于垂直搜索的企业位置信息获取分析及存储方法在审
申请号: | 201610387587.5 | 申请日: | 2016-06-05 |
公开(公告)号: | CN107463560A | 公开(公告)日: | 2017-12-12 |
发明(设计)人: | 范从俊;何宏靖 | 申请(专利权)人: | 贵州双龙数联科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 550005 贵州省贵阳市*** | 国省代码: | 贵州;52 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 垂直 搜索 企业 位置 信息 获取 分析 存储 方法 | ||
1.用于垂直搜索的企业位置信息获取分析及存储方法,其特征在于,根据企业地址调用地图平台接口获取企业的地理经纬度信息,通过从至少两家地图平台获取到的经纬度数据来进行相互验证和补全,找出可信度较高的经纬度信息作为企业对应的地理经纬度信息,并将企业信息和获取到的经纬度信息存储于分布式文件系统中;建立包含企业名称、经度和纬度字段的索引映射格式;将存储于分布式文件系统中的企业信息和对应的经纬度信息导入索引中。
2.如权利要求1所述的方法,其特征在于,所述分布式文件系统为HDFS。
3.如权利要求1所述的方法,其特征在于,使用ElasticSearch来建立索引。
4.如权利要求1所述的方法,其特征在于,所述地图平台包括:第一地图平台、第二地图平台和,或第三地图平台。
5.如权利要求4所述的方法,其特征在于,所述数据相互验证和补全,包含以下实现步骤:
(ST1)调用第一地图平台接口,获得企业第一经度数据和第一纬度数据;
(ST2)调用第二地图平台接口,获得企业第二经度数据和第二纬度数据;
(ST3)所述数据相互验证和补全,适用以下规则条件:
A、如果从第一地图平台获取的经纬度数据完整,而从第二地图平台获取到的经纬度数据有缺失,则选择第一经度数据和第一纬度数据作为企业的地理经纬度信息;
B、选择从平台获取到的数据信息中,可信较高的对应经纬度信息为企业的经纬度数据;
C、比较第一经度数据和第二经度数据,得到差值数据1,比较第一纬度数据和第二纬度数据,得到差值数据2,如果差值数据1和差值数据2均在设置的阈值内,则可选择将第一经度数据、第一纬度数据或者第二经度数据、第二纬度数据作为企业的地理经纬度数据。
6.如权利要求5所述的方法,其特征在于,所述数据相互验证和补全过程通过Mapreduce并行处理。
7.如权利要求1至6之一所述的方法,其特征在于,所述方法包含以下实现步骤:
(1)通过网络爬虫来获取企业名称和对应的地址信息;
(2)根据企业地址信息调用地图平台接口来获取对应的企业的地理经纬度信息;
(3)将获取到的企业名称、企业地址和企业经度信息、企业纬度信息存储于HDFS分布式文件系统中;
(4)创建ElasticSearch索引格式,所述索引存储的字段包含企业名称、企业地址和企业经度信息、企业纬度信息;
(5)将HDFS分布式文件系统中所存储的企业名称、企业地址和企业经度信息、企业纬度信息导入索引之中,形成基于ElasticSearch的企业地理信息索引文件。
8.如权利要求7所述的方法,其特征在于,所述步骤(5)中,用Mapreduce云计算批量读取企业名称、企业地址和企业经度信息、企业纬度信息文件写入索引中。
9.如权利要求8所述的方法,其特征在于,所述步骤(5)中,按照索引映射格式把每条企业信息数据的:企业名称对应写入索引的name,企业地址对应写入索引的addr,企业地理信息经度对应写入索引的lon,企业地理信息纬度对应写入索引的lat。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贵州双龙数联科技有限公司,未经贵州双龙数联科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610387587.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:地埋式喷头
- 下一篇:车载手机支架(重力自动锁)