[发明专利]一种疑似污染场地时空信息识别方法在审
申请号: | 202010532408.9 | 申请日: | 2020-06-11 |
公开(公告)号: | CN111651432A | 公开(公告)日: | 2020-09-11 |
发明(设计)人: | 杨海坤;万庆;王彩云;张筝;魏长河;朱云翔;展明旭 | 申请(专利权)人: | 中科山水(北京)科技信息有限公司;厦门青霭信息科技有限公司 |
主分类号: | G06F16/21 | 分类号: | G06F16/21;G06F16/215;G06F16/22;G06F16/2458;G06F16/25;G06F16/27;G06F16/23;G06F16/951;G06F16/958;G06Q10/10;G06Q50/26 |
代理公司: | 北京天江律师事务所 11537 | 代理人: | 任崇 |
地址: | 100070 北京市丰台区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 疑似 污染 场地 时空 信息 识别 方法 | ||
1.一种疑似污染场地时空信息识别方法,其特征在于:所述的方法包括以下步骤:
步骤一、设计疑似污染地名录数据库表结构,实现疑似污染地时空信息表征;
步骤二、分析疑似污染场地名录各项指标的数据源;
步骤三、结合步骤二的疑似污染场地数据源分析,实现疑似污染场地名录指标信息的初步挖掘;
步骤四、对初步挖掘的疑似污染场地名录进行信息验证与补充;
步骤五、建立疑似污染场地动态名录库。
2.根据权利要求1所述的疑似污染场地时空信息识别方法,其特征在于:步骤一中,疑似污染地名录数据库表结构的设计过程为:
通过收集与研充相关文件和文献资料,分析我国污染场地管理的业务需求,构建以地块为基础的疑似污染场地数据管理模型;结合国家、行业标准,利用对象编码规则以及数据库表结构化表达,并保持相关术语的语义一致,设计疑似污染地名录数据库表结构。
3.根据权利要求2所述的疑似污染场地时空信息识别方法,其特征在于:疑似污染地名录数据库表结构中包括的字段有:对象唯一标识指标,如对象名称、对象编码;对象时空信息指标,如所在位置、经纬度、成立时间、投产时间、关停时间;对象管理属性指标,如企业规模、行政处罚及环境处罚信息、经营信息、信用指标;对象污染属性指标,如行业类别、主要污染物、污染类别。
4.根据权利要求3所述的疑似污染场地时空信息识别方法,其特征在于:步骤二中疑似污染场地数据的分析过程为:
在我国污染场地管理业务需求分析成果基础上,进一步通过对相关业务部门调研、行业专家咨询以及资料检索、收集、分析,确定疑似污染场地各项表征指标的数据来源。
5.根据权利要求4所述的疑似污染场地时空信息识别方法,其特征在于:疑似污染场地各项表征指标的数据源包括:已有可共享数据库、生态环境部门网站、政府及其他部门网站、专业企业工商信息网站、相关社会组织网站以及公共地图网站。
6.根据权利要求5所述的疑似污染场地时空信息识别方法,其特征在于:步骤三中,结合疑似污染场地数据源分析,针对不同的数据源、原始数据存在形式采用不同的数据获取策略,初步实现疑似污染场地的名录指标信息挖掘,包括:
(1)对于已有可共享的数据库,通过ETL数据抽取转换技术获取相关名录指标;
(2)对于网页中的文件,先将文件下载到本地,再结合数据处理工具,结合分类、对比等方法,通过计算机自动分析和人机交互分析实现对象去重,整合形成统一的对象名录,同时提取部分关键指标;
(3)对于网页中的某个指标,结合语义分析,利用数据爬取工具,辅以编码工作,实现对应指标的信息爬取;
(4)对于对象的空间位置信息,结合反地理编码以及人机交互分析获取其经纬度坐标;
通过以上数据指标挖掘方法,从多源地理大数据数据源中,分析、提取、融合得到疑似污染场地的名录指标,初步形成疑似污染场地时空信息数据库。
7.根据权利要求6所述的疑似污染场地时空信息识别方法,其特征在于:步骤四中,结合潜在污染行业、工艺流程和工艺产品的知识、相关数据清洗技术和遥感数据人机交互识别技术,对初步形成疑似污染场地名录信息进行数据清洗、质量审核以及补充,包括以下环节:
(1)对于下载文件的数据融合成果,通过抽杆审查的方法,分地区抽取疑似污染场地名录信息,对包括对象一致性判别、对象指标语义理解是否准确等进行分析与审查;
(2)对于通过数据爬取工具爬取的成果,通过抽样审查方法,随机抽取的疑似污染场地名录信息,结合潜在污染行业、工艺流程和工艺产品以及对象的经营范围,分析所爬取的对象是否为疑似污染场地,并结合分析成果提出数据清洗策略,开展批量数据清洗;
(3)抽取部分对象,与区域土地利用类别数据进行对比,对所属行业类别对应土地利用不一致的提出质疑与完善;
(4)抽取部分对象,结合高精度遥感影像进行判别,分析对象在指定空间位置存在的客观性。
8.根据权利要求7所述的疑似污染场地时空信息识别方法,其特征在于:通过数据库物理建库、数据导入等方式建立疑似污染场地数据库;同步构建疑似污染场地名录更新机制,包括明确数据更新频率,明确不同区域、不同行业疑似污染场地名录更新数据源,明确具体名录指标的数据源获取顺序,从而构建全国尺度的疑似污染场地动态名录库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科山水(北京)科技信息有限公司;厦门青霭信息科技有限公司,未经中科山水(北京)科技信息有限公司;厦门青霭信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010532408.9/1.html,转载请声明来源钻瓜专利网。