[发明专利]一种基于字段数据和坐标共性合并不同行业数据的方法有效

专利信息
申请号: 201711164685.3 申请日: 2017-11-21
公开(公告)号: CN107967313B 公开(公告)日: 2022-02-01
发明(设计)人: 程丽雅;刘艳民;赵慧贤;侯立涛 申请(专利权)人: 中科宇图科技股份有限公司
主分类号: G06F16/215 分类号: G06F16/215;G06F16/2458;G06F16/29
代理公司: 北京市盛峰律师事务所 11337 代理人: 梁艳
地址: 100101 北京市朝*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 字段 数据 坐标 共性 合并 不同 行业 方法
【说明书】:

发明公开了一种基于字段数据和坐标共性合并不同行业数据的方法,涉及环境污染源普查技术领域。该方法,基于一定业务规则,从多部门多行业提供的数据库中筛选出与环境污染相关的企业名单,并赋予空间属性,通过地址码补全与校验、自动匹配、智能筛选、人工筛选等步骤,合并不同行业企业数据,从而解决不同行业多种数据源的融合匹配问题。为第二次污染源普查提供精准的普查数据库,同时也为多来源的不同行业企业数据融合和匹配提供典型示范案例,为环境管理提供更精准的污染源清单,以实现更精准的环境管理决策。

技术领域

本发明涉及环境污染源普查技术领域,尤其涉及不同领域的多源污染源数 据的匹配与整合、清洗的方法,具体涉及一种基于字段数据和坐标共性合并不 同行业数据的方法。

背景技术

目前,《关于开展第二次全国污染源普查的通知》要求基于国家统计局、国 家工商总局、国家质检总局、住建部、国家电网等部门数据,结合测绘局的基 础地理数据,开展第二次全国污染源普查基本单位名录库(PSLD)建设。

但是,多部门同一污染源数据匹配过程中经常出现同一指标多个不同值的 情况,多样化的污染源属性值给第二次全国污染源普查基本单位名录库建设工 作带来繁重的数据筛选和审核工作量。针对不同领域不同行业企业多源数据融 合的问题,最需要的就是找到一种不同行业多种数据源进行融合、自动匹配的 方法,实现不同数据源之间的互补和统一。

发明内容

本发明的目的在于提供一种基于字段数据和坐标共性合并不同行业数据的 方法,从而解决现有技术中存在的前述问题。

为了实现上述目的,本发明采用的技术方案如下:

一种基于字段数据和坐标共性合并不同行业数据的方法,包括如下步骤:

S1,接入国家统计局数据以及其他行业的污染源企业数据;

S2,以补全地址编码的国家统计局数据作为基础数据,以污染源企业的基 本属性为指标,对其他行业的污染源企业数据进行自动匹配,如果匹配成功, 则确定为同一污染源企业数据,并录入到污染源企业名录库中,否则,执行S3;

S3,采用智能化筛选模块中的语义包含工具进行对比筛选,如果不同数据 库的字段值在一定范围内相互匹配,则确定为同一污染源企业数据,并录入到 污染源企业名录库中,否则,执行S4;

S4,确认剩余数据项各字段的完整性和合理性,并通过所提供的字段信息 进行人工查询和筛选匹配,如果匹配成功,则确定为同一污染源企业数据,并 录入到污染源企业名录库中,否则,人工剔除。

优选地,所述其他行业的污染源企业数据包括工商总局数据、国家电网数 据、质检总局以及税务总局数据、农业普查数据和/或住建部市政排污口数据。

优选地,所述污染源企业的基本属性指标包括:统一社会信用代码、单位 名称、单位地址及区划代码、联系方式、主要业务活动及行业代码、登记注册 类型、机构类型、营业状态、和/或法人单位与其下属产业活动单位的关系。

优选地,S2中,所述自动匹配,具体为:针对统一社会信用代码、企业名 称、企业地址信息进行精确匹配,对未能精确匹配上的数据在统一社会信用代 码精确匹配的前提下,进行企业名称、企业地址信息的模糊匹配;精确匹配以 及模糊匹配成功的数据录入到污染源企业名录库中,对于未匹配成功的数据则 继续执行S3。

优选地,S1和S2之间还包括步骤,获取补全地址编码的国家统计局数据, 采用如下方法进行实施:利用地址编码补全机制中的时空大数据技术,对没有 地理信息的污染源企业数据,自动补全地理信息,对已有地址编码的污染源企 业数据进行坐标转换,并进行时空效验。

优选地,S2和S3之间还包括步骤,为模糊数据字段的值设定一个语义空间, 使得每个模糊数据的取值为该语义空间的子集。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科宇图科技股份有限公司,未经中科宇图科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711164685.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top