[发明专利]RNN模型的逐点损失估计优化方法在审
申请号: | 201910225341.1 | 申请日: | 2019-03-25 |
公开(公告)号: | CN109961143A | 公开(公告)日: | 2019-07-02 |
发明(设计)人: | 潘丽敏;闫晗;罗森林;胡雅娴 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/02 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种RNN模型的逐点损失估计优化方法,属于计算机与信息科学技术领域。该方法包括:按时间顺序将多个时间节点不同的数据集拼接成一个时间序列数据集,被拼接的数据包括各特征值和标签;利用CART决策树算法从拼接数据集中提取重要程度较高的特征,构成新的数据集;对新数据集进行数据重采样,填充各时间节点缺失的数据;基于逐点估计的损失函数训练RNN模型。由于本发明在损失函数的计算中引入了逐点损失估计,因此可以避免因长时间传输造成的信息丢失和误差增加,从而克服RNN在处理长时序列时易出现梯度爆炸或梯度消失的问题。 | ||
搜索关键词: | 损失估计 拼接 时间节点 损失函数 数据集 时间序列数据 信息科学技术 决策树算法 时间传输 时间顺序 数据包括 数据集中 信息丢失 新数据 重采样 长时 填充 优化 标签 引入 计算机 爆炸 | ||
【主权项】:
1.RNN模型的逐点损失估计优化方法,其特征在于所述方法包括如下步骤:步骤1,按时间顺序对n个时间节点不同的数据集进行拼接,拼接所得数据集的样本xi由各个时间节点的样本ti,j组成,时间节点的间隔为1小时,每个样本最多有n个时间节点的特征值和标签;步骤2,如果拼接数据集的特征维度大于10维,则以基尼指数作为特征重要性的评价指标,使用CART决策树算法对原始特征进行筛选,取出重要度排序位于前10的特征构成新的数据集;步骤3,对数据集进行数据重采样;步骤4,假设某样本xi包含的总时刻数为T,利用第1个时刻到第T个时刻的实际输出和分类标签y(n)=tag{ti,n}计算损失函数L,最终根据损失函数L,使用反向传播算法更新网络参数。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910225341.1/,转载请声明来源钻瓜专利网。