[发明专利]一种企业位置信息获取分析及存储系统在审
申请号: | 201610387565.9 | 申请日: | 2016-06-05 |
公开(公告)号: | CN107463559A | 公开(公告)日: | 2017-12-12 |
发明(设计)人: | 范从俊;何宏靖 | 申请(专利权)人: | 贵州双龙数联科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 550005 贵州省贵阳市*** | 国省代码: | 贵州;52 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 企业 位置 信息 获取 分析 存储系统 | ||
技术领域
本发明涉及互联网信息处理领域,特别涉及一种企业位置信息获取分析及存储系统。
背景技术
以信息技术发展为代表的社会进步,数据信息的积累以级数速度增长,网络技术的发展促进了信息的传播和积累,网络信息数据涵盖了社会、经济、政治、行业、企业、组织、个人活动的方方面面,数据量大和价值密度低却是困扰如此海量数据信息挖掘利用的难题,在海量的数据里面,如何精确的获得人们关心的信息成为迫切解决的问题,在巨大的市场需求面前,互联网搜索和大数据分析成为当今互联网应用的热门;各种搜索引擎也应运而生,其中垂直搜索引擎是针对某一个行业的专业搜索引擎,相对通用搜索引擎的信息量大、查询不准确、深度不够等缺点,垂直搜索通过针对某一特定领域、某一特定人群或某一特定需求提供的有一定价值的信息和相关服务,具有“专业”、“精准”、“深度挖掘”的特点,且具有行业色彩。然而目前市场针对企业的垂直搜索还比较鲜见。
而企业信息是数据分析的重要一环;在数据分析中具有重要的意义,由于企业作为社会经济中最重要的活动主体,在经济中扮演着重要的角色,对于企业信息的整理和分析可以了解企业的背景、勾勒出企业活动的生产情况、经营状况、人员信息、投资情况、股东构成、企业资质、资产规模、资产增长情况以及异常情况。这些信息对于监控企业发展状态和防范企业经营风险具有极其重要的意义,而在企业的信息中地理信息是相当重要的一环,对于企业本身的区域关联、业务拓展、价值挖掘,以及整体经济的区域分类,隐藏的地域、地理商业价值的分析和挖掘都大有裨益。
现有的公用地理信息地图系统,没有公开的专门的搜索企业以及企业关系的搜索平台,只有酒店,餐馆、景点等的专门搜索;大而全的通用搜索,突出不了专注企业搜索的意义;更搜索不了以某个位置为中心的周围的不知道名字的企业。所以结合已有的大数据量的企业信息,建立专门的企业地理信息系统对针对企业信息大数据分析的公司是必要的需求。
而要建立这样的系统,首先要做的就是集合企业数据,建立企业位置信息高效的获取和存储系统。
发明内容
本发明的目的在于克服现有技术中所存在的上述不足,提供一种企业位置信息获取分析及存储系统。通过使用企业基本信息来获取企业地理信息;在获取的地理信息上建立适当的存储模型和查询模型,为基于地理位置的企业信息查询提供基础。
为了实现上述发明目的,本发明提供了以下技术方案:
一种企业位置信息获取分析及存储系统,所述系统包括企业地理信息获取模块、企业地理信息存储模块和索引文件模块;
所述企业地理信息获取模块根据企业地址调用地图平台接口获取企业的地理经纬度信息,通过从至少两家地图平台获取到的经纬度数据来进行相互验证和补全,找出可信度较高的经纬度信息作为企业对应的地理经纬度信息;
所述企业地理信息存储模块用于存储企业信息和获取到的经纬度信息;
所述索引文件模块建立包含企业名称、经度和纬度字段的索引映射格式;将存储于所述企业地理信息存储模块中的企业信息和对应的经纬度信息导入索引中。
进一步的,所述地图平台包括:第一地图平台、第二地图平台和,或第三地图平台。
具体的,所述数据相互验证和补全,包含以下实现步骤:
(ST1)调用第一地图平台接口,获得企业第一经度数据和第一纬度数据;
(ST2)调用第二地图平台接口,获得企业第二经度数据和第二纬度数据;
(ST3)对不一致的数据按照各个开放平台返回结构的分数排序,取可信值分数较高的;并按照各个开放平台之间地图坐标系的区别,分别计算相对应的值。所述数据相互验证和补全,适用以下规则条件:
A、如果从第一地图平台获取的经纬度数据完整,而从第二地图平台获取到的经纬度数据有缺失,则选择第一经度数据和第一纬度数据作为企业的地理经纬度信息;
B、选择从平台获取到的数据信息中,可信较高的对应经纬度信息为企业的经纬度数据;
C、比较第一经度数据和第二经度数据,得到差值数据1,比较第一纬度数据和第二纬度数据,得到差值数据2,如果差值数据1和差值数据2均在设置的阈值内,则可选择将第一经度数据、第一纬度数据或者第二经度数据、第二纬度数据作为企业的地理经纬度数据。
作为一种优选,所述地理信息存储模块为HDFS分布式文件系统。
作为一种优选,所述索引文件模块使用ElasticSearch来建立搜索索引。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贵州双龙数联科技有限公司,未经贵州双龙数联科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610387565.9/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置