[发明专利]一种基于文献的污染地块信息综合分析方法有效
申请号: | 201910084134.9 | 申请日: | 2019-01-29 |
公开(公告)号: | CN109815315B | 公开(公告)日: | 2020-09-22 |
发明(设计)人: | 马妍;阮子渊;运晓彤;谢云峰;杜晓明;史怡;谷庆宝;王佳琪;张梦頔;张美娟;周生坤 | 申请(专利权)人: | 中国矿业大学(北京) |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/38;G06F16/31;G06F16/2455;G06Q50/26 |
代理公司: | 北京劲创知识产权代理事务所(普通合伙) 11589 | 代理人: | 张铁兰 |
地址: | 100083 北京市海淀区北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 文献 污染 地块 信息 综合分析 方法 | ||
1.一种基于文献检索的污染地块信息综合分析方法,其特征在于,所述方法包括以下步骤:
S1:通过特征关键词从开放平台检索获取相应文献,使用文献管理软件对检索得到的文献基本信息进行管理分类,并筛选出调查类文献,建立研究文献数据库;根据研究方向从多个宏观和/或微观层面选取特征关键词,所述特征关键词是包括场地、污染介质、行业类型、有机污染物种类、污染物在内的相关中英文关键词;
S2:读取检索获取的所述调查类文献中的数字化文献内容,对文献内容中的所有自然段落进行预处理,将所述自然段落根据结构相特征词,判定其描述内容,并划分为包括地块基本信息、研究对象基本信息、污染物监测与评价信息在内的多个内容片段,所述特征词是文献中用于描述对应章节内容的词组;
所述地块基本信息、研究对象基本信息、污染物监测与评价信息分别包括的结构项特征词如下表所示:
S3:对划分后的各内容片段中的原始内容,进行结构化数据的提取;
所述对各内容片段进行结构化数据的提取具体为:
S31:将所述各内容片段中的原始内容转换为预定义的标准格式;
S32:将转换后的标准格式内容组织成结构化数据;
S33:通过包括人工抽查、机器学习在内的形式对数据进行校验;
S4:通过数据库描述语言查询已提取的污染地块结构化信息。
2.根据权利要求1所述的基于文献检索的污染地块信息综合分析方法,其特征在于,S1中所述的文献基本信息包括篇名、期刊名、作者、摘要、关键词、发表时间和单位。
3.根据权利要求1所述的基于文献检索的污染地块信息综合分析方法,其特征在于,S1中所述污染介质包括受影响的地块土壤介质和地下水介质。
4.根据权利要求1所述的基于文献检索的污染地块信息综合分析方法,其特征在于,S31中所述预定义的标准格式包括地理位置或坐标的统一、各计量单位的统一及污染物名称的统一。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国矿业大学(北京),未经中国矿业大学(北京)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910084134.9/1.html,转载请声明来源钻瓜专利网。