[发明专利]一种基于知识增强的深度学习的总氮含量预测方法在审
申请号: | 202110992754.X | 申请日: | 2021-08-27 |
公开(公告)号: | CN113836260A | 公开(公告)日: | 2021-12-24 |
发明(设计)人: | 闫健卓;高青彩;陈建辉;于涌川 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/36;G06F16/951;G06N3/04;G06N3/08 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识 增强 深度 学习 含量 预测 方法 | ||
本发明公开一种基于知识增强的深度学习的总氮含量预测方法,该方法通过分析百度百科关于水质污染参数的信息和水质参数文献,构建了水质知识图谱,得到水质参数之间的知识级信息,并提取出反映水质参数的知识级特征信息,并将其和数据级特征信息结合作为先验知识去解决水质预测问题。另一方面,通过将对抗学习和深度神经网络水质预测模型结合,以提高了模型的鲁棒性和泛化性。最后,将带有知识级和数据级的特征信息输入到水质预测模型中,预测河流总氮的浓度。实验结果表明,该方法将知识级信息和数据级信息结合,融入到基于对抗学习的神经网络水质预测模型中,提高了水质参数的预测精度。
技术领域
本发明属于计算机科学计算领域,涉及一种基于知识增强的深度学习的总氮含量预测方法。
技术背景
在大多数预测水质模型中,都是对从传感器得来的数据进行分析,但是对于水质参数之间的关联仅仅从数据级分析是远远不够的,因此加入了知识图谱,从知识图谱中得到语义级的信息。对于某一个测站的数据量少的问题,我们加入了对抗学习,使预测模型更具有鲁棒性。
发明内容
本发明要解决的技术问题是,提供一种基于知识增强的深度学习的总氮含量预测方法。该方法首先通过分析百度百科关于水质污染参数的信息和水质参数文献,构建了水质知识图谱,得到水质参数之间的知识级信息,并将其和数据级信息结合作为先验知识去解决水质预测问题。然后,通过对抗学习和深度神经网络水质预测模型结合,提出了一种新的水质预测方法,以实现对河流总氮浓度的预测。
为解决上述问题,本发明采用如下的技术方案:
一种基于知识增强的深度学习的总氮含量预测方法包括以下步骤:
步骤1、数据预处理。
对从知网上爬取到的论文和维基百科和百度百科爬取到的关于水质参数的文本数据进行停用词处理。
步骤2、构建水质知识图谱。
利用步骤1中的数据构建水质知识图谱。
步骤3、训练GCN模型。
首先,利用word2vec将知识图谱中的实体向量化;其次,将实体向量和关系信息输入到GCN网络中,使得每个实体节点的信息和邻居节点的特征信息聚合起来做非线性变换;最后得到更有价值的节点向量。
步骤4、融合知识级信息和数据级信息。
在知识级方面,对步骤3得到的节点特征向量进行相关性计算;在数据级方面,计算各水质参数的相关性系数;最后将两个相关性系数转化为权重比例相结合。
步骤5、训练基于对抗学习的CNN-LSTM模型。
利用对抗扰动训练CNN-LSTM模型的输入。将水质参数数据和各自权重结合输入到CNN,进一步提取特征向量,将CNN得到的特征向量输入到LSTM中,完成总氮浓度的预测。
步骤6、评价模型。
使用模型评价指标评价模型性能。
附图说明
图1为基于知识增强的深度学习的总氮含量预测框架结构图;
图2为基于知识增强的深度学习的总氮含量预测的流程图。
具体实施方式
下面结合附图对本发明做进一步说明:
如图1所示,本发明方法主要包括以下步骤:
步骤1、数据预处理
对从知网上爬取到的论文和维基百科和百度百科爬取到的关于水质参数的文本数据进行停用词处理。
步骤2、构建水质知识图谱
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110992754.X/2.html,转载请声明来源钻瓜专利网。