[发明专利]一种面向异构时距的科学研究热点预测方法及系统有效

专利信息
申请号: 201910460301.5 申请日: 2019-05-29
公开(公告)号: CN110188263B 公开(公告)日: 2021-11-30
发明(设计)人: 马艳;邹立达;齐达立;陈玉峰 申请(专利权)人: 国网山东省电力公司电力科学研究院;国家电网有限公司
主分类号: G06F16/9532 分类号: G06F16/9532;G06N3/04;G06N3/08
代理公司: 济南圣达知识产权代理有限公司 37221 代理人: 邓建国
地址: 250002 山东*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 面向 异构时距 科学研究 热点 预测 方法 系统
【权利要求书】:

1.一种面向异构时距的科学研究热点预测方法,其特征是,包括以下步骤:

1)提取特征:在科技新闻网站、文献数据库爬取科技信息文章,并对文本数据进行向量表示与向量提取;

2)分析预测需求:分析用户需要预测热点的时间跨度;

3)生成预测模型:生成嵌入BP神经网路的RNN预测模型;所述嵌入BP神经网路的RNN预测模型的最底层是一个经典RNN,在每个循环中嵌入一个子RNN,子RNN的每个循环还嵌入孙RNN;4)训练预测模型:对嵌入BP神经网路的RNN预测模型进行逐层训练;在训练预测模型的过程中,首先训练最高层RNN,依次训练下一层RNN;

5)生成预测结果:将数据输入训练后预测模型生成研究热点预测结果;

所述训练预测模型的过程包括以下步骤:

a)确定每层的训练数据:

{xi|i∈[t-hKg,t],i%K=0},

其中g为层号,h为训练数据周期系数,K为每层长度,xi为训练数据,t为周期终止时刻,i为训练数据标识;

b)对BP神经网络采用通用方法进行训练,在研究热点预测时接收RNN前向传播的特征,并在求梯度时向RNN传递误差项;

c)采用标准前向传播方法、多层前向传播方法和多层误差反向传播方法对RNN网络进行训练,并计算梯度。

2.根据权利要求1所述的一种面向异构时距的科学研究热点预测方法,其特征是,所述提取特征的具体过程为:利用爬虫技术在科技新闻网站、文献数据库爬取科技信息文章,同时利用权重TF-IDF算法及深度玻尔兹曼机方法对文本数据进行向量表示与向量提取;最终提取的向量表示为一个时序数据X,时序数据X是模型训练模块、预测结果模块的数据来源。

3.根据权利要求1所述的一种面向异构时距的科学研究热点预测方法,其特征是,所述分析预测需求的具体过程为:基于与用户的交互,分析用户需要预测热点的时间跨度,并利用时间跨度数据生成预测模型。

4.根据权利要求1所述的一种面向异构时距的科学研究热点预测方法,其特征是,所述步骤c)具体过程为:

C1)标准RNN前向传播训练过程:

向量netk表示循环神经元在k时刻的加权输入,其计算方法为:

nett=Uxt+WSt-1

其中,Sk为k时刻循环层的值,且Sk=G(netk),G()为激活函数;W为循环权重,U为输入权重;

C2)多层前向传播训练过程:

上层即G1层,G1层训练完成后,训练下层即G0层;

G0层前向传播在标准前向传播训练过程基础上,还在G1层时用以下公式进行传递:

其中,带点符号代表G1层的对应参数,采用X中时序点数据的均值;

C3)多层误差反向传播训练过程:

G1层在训练时采用标准的RNN误差反向传播方法,G0层训练时,除了用标准的RNN误差反向传播训练过程基础上,还在G1层时用以下公式进行传递误差:

其中,δ表示各循环周期的误差项,diag[x]表示根据向量x创建一个对角矩阵;

C4)计算误差函数E对任意周期k权重矩阵Wk的梯度:

G1层用如下公式计算梯度:

G0层用如下公式计算梯度:

其中δk,i表示δk误差项向量的第i个分量,表示的第j个神经元的输出值,为δk左邻子模块;

误差函数E对循环层权重矩阵W的梯度是各个时刻的梯度之和,计算公式如下:

5.根据权利要求1-4任意一项所述的一种面向异构时距的科学研究热点预测方法,其特征是,所述预测结果发送给用户界面。

6.一种面向异构时距的科学研究热点预测系统,其特征是,包括:

特征提取模块,用于在科技新闻网站、文献数据库爬取科技信息文章,并对文本数据进行向量表示与向量提取;

预测需求分析模块,用于分析用户需要预测热点的时间跨度;

预测模型生成模块,用于生成嵌入BP神经网路的RNN预测模型;所述嵌入BP神经网路的RNN预测模型的最底层是一个经典RNN,在每个循环中嵌入一个子RNN,子RNN的每个循环还嵌入孙RNN;

预测模型训练模块,用于对嵌入BP神经网路的RNN预测模型进行逐层训练;在训练预测模型的过程中,首先训练最高层RNN,依次训练下一层RNN;

预测结果生成模块,用于将数据输入训练后预测模型生成研究热点预测结果;

所述预测模型训练模块包括:

训练数据确定模块,用于确定每层的训练数据;

BP神经网络训练模块,用于对BP神经网络采用通用方法进行训练,在研究热点预测时接收RNN前向传播的特征,并在求梯度时向RNN传递误差项;

RNN网络训练模块,用于采用标准前向传播方法、多层前向传播方法和多层误差反向传播方法对RNN网络进行训练,并计算梯度。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网山东省电力公司电力科学研究院;国家电网有限公司,未经国网山东省电力公司电力科学研究院;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910460301.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top