[发明专利]一种基于文献的污染地块信息综合分析方法有效
申请号: | 201910084134.9 | 申请日: | 2019-01-29 |
公开(公告)号: | CN109815315B | 公开(公告)日: | 2020-09-22 |
发明(设计)人: | 马妍;阮子渊;运晓彤;谢云峰;杜晓明;史怡;谷庆宝;王佳琪;张梦頔;张美娟;周生坤 | 申请(专利权)人: | 中国矿业大学(北京) |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/38;G06F16/31;G06F16/2455;G06Q50/26 |
代理公司: | 北京劲创知识产权代理事务所(普通合伙) 11589 | 代理人: | 张铁兰 |
地址: | 100083 北京市海淀区北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 文献 污染 地块 信息 综合分析 方法 | ||
本发明提供了一种基于文献的污染地块信息综合分析方法,所述分析方法包括如下步骤:通过特征关键词从开放平台检索获取相应文献;读取检索获取的文献中的数字化文献内容,并将对应的文献内容划分为多个内容片段;对划分后的各内容片段中的原始内容,使用所述分析系统对各内容片段进行结构化数据的提取;通过数据库描述语言查询已提取的污染地块结构化信息。本发明所述的分析方法,能够针对土壤环境监管领域中的海量文献,通过计算机辅助的形式,有效地提取出污染地块污染情况的结构化信息并使用专业数据库进行存储,具有高效、准确的特点。
技术领域
本发明属于土壤污染监管领域,特别涉及一种基于文献的污染地块信息综合分析方法。
背景技术
在土壤环境监管领域,研究者和技术人员常常需要能够从海量的文字资料中快速而准确的获取对应地块土壤污染情况等内容,以便于对其进行深入的分析或者进一步的知识发现。所以,从数量庞大、内容复杂的文献中获取结构化的描述内容是摆在科研人员面前的一个重要的问题。
现有的工作方式中,从土壤研究文献中提取对应研究内容主要依赖人工对文献内容进行通读,然后再对他们进行标注提取。该种工作方式需要很多具有丰富经验和专门知识的分类人员做大量的工作,不仅代价高昂,效率底下,且容易出错。
发明内容
针对上述存在的问题,本发明的目的是提供一种基于文献的污染地块信息综合分析方法。通过计算机辅助的形式,规范文献识别范围以及识别内容,并辅以二次校验的方式,可以很好的解决上述问题。
本发明的目的是通过以下技术方案实现的:
一种基于文献的污染地块信息综合分析系统,包括文献基本信息模块、地块基本信息模块、研究对象信息模块和污染物监测与评价数据信息模块;
所述文献基本信息模块,用于获取包括文献名称、来源期刊、发表时间在内的文献相关信息;
所述地块基本信息模块,用于确定目标污染地块中的包括地理位置、生产信息、污染区域面积、地块规划用途在内的相关信息;
所述研究对象信息模块,用于获取包括调查时间、检测方法在内的目标地块的相关信息;
所述污染物检测与评价数据模块,用于获取目标污染地块污染物的污染情况的描述性信息。
一种基于文献的污染地块信息综合分析方法,包括以下步骤:
S1:通过特征关键词从开放平台检索获取相应文献,使用文献管理软件对检索得到的文献基本信息进行管理分类,建立研究文献数据库;
根据研究方向从多个宏观和/或微观层面选取特征关键词,所述特征关键词是包括场地、污染介质、行业类型、有机污染物种类、污染物在内的相关中英文关键词;
S2:读取检索获取的所述调查类文献中的数字化文献内容,对文献内容中的所有自然段落进行预处理,将所述自然段落根据结构相特征词,判定其描述内容,并划分为包括地块基本信息、研究对象基本信息、污染物监测与评价信息在内的多个内容片段,所述特征词是文献中用于描述对应章节内容的词组;
S3:对划分后的各内容片段中的原始内容,进行结构化数据的提取;
S4:通过数据库描述语言查询已提取的污染地块结构化信息。
进一步的,S1中所述的文献基本信息包括篇名、期刊名、作者、摘要、关键词、发表时间和单位。
进一步的,S1中所述污染介质包括受影响的地块土壤介质和地下水介质。
进一步的,S2中所述地块基本信息、研究对象基本信息、污染物监测与评价信息分别包括的结构项特征词如下表所示:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国矿业大学(北京),未经中国矿业大学(北京)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910084134.9/2.html,转载请声明来源钻瓜专利网。