[发明专利]基于图卷积神经网络的时序数据事件预测方法、系统及其应用有效
申请号: | 202010124544.4 | 申请日: | 2020-02-27 |
公开(公告)号: | CN111367961B | 公开(公告)日: | 2023-03-28 |
发明(设计)人: | 钱步月;李扬;潘迎港;王谞动;刘洋;吕欣;蔡宏伟;兰欣 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06N3/0464;G06N3/08 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 孟大帅 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 图卷 神经网络 时序 数据 事件 预测 方法 系统 及其 应用 | ||
本发明公开了一种基于图卷积神经网络的时序数据事件预测方法、系统及其应用,包括:将数据清洗后的时序数据以预定的时间间隔转换成事件序列数据,获得事件与事件集合的向量表示;将事件序列数据中每一条序列样本数据最后一个时刻所包含的事件集合作为预测目标,将其作为对应序列样本标签,得到已标注的事件序列数据;当图卷积神经网络模型被训练至满足预设定的收敛条件时,使用测试集对模型预测效果进行测试,取测试效果的模型作为最终的事件预测模型。本发明可弥补传统方法对数据数量及质量要求高、无法充分利用知识图谱的缺陷。
技术领域
本发明属于数据挖掘及机器学习技术领域,涉及时序数据事件预测领域,特别涉及一种基于图卷积神经网络的时序数据事件预测方法、系统及其应用。
背景技术
根据历史时序数据对未来可能发生的事件进行预测是数据挖掘与机器学习领域重要的研究方向。目前的主要方法是通过传统机器学习或深度学习技术挖掘时序数据所包含的隐藏模式,并利用这些信息计算出未来某些事件发生的概率,进而达到事件预测的目的。
时序数据通常具有时序性、高维度、高噪声等特点,使用传统机器技术对时序数据建模需先由领域专家进行数据的人工特征提取,再使用机器学习预测模型使用这些数据特征进行预测。其中,特征提取方式面对大量高维的数据时效率非常低下,同时模型预测效果会因特征的选择而产生差异,缺乏鲁棒性。
近些年,深度学习技术因其强大的特征自动提取能力而被成功应用于多种领域;其中,循环神经网络模型因其优异的时间序列特征提取能力而被广泛应用于时序数据的事件预测应用中。对于深度学习预测模型而言,其性能很大程度上受到数据数量与质量的影响。为了减缓由数据质量而导致的预测性能降低,目前最有效的方式是在深度学习模型的训练及预测过程中引入与数据相关联的知识图谱,丰富原始数据中所包含的信息,进而提升模型的预测性能。知识图谱属于图结构数据,其中节点表示某一变量,节点间的边代表节点间的关系,因此空间结构属于图结构数据的重要特征。
综上,目前存在的问题包括:基于卷积神经网络的深度学习模型仅适用于一维或多维网格状数据,无法有效的从图结构数据中提取关键特征;通过注意力机制(AttentionMechanism)引入知识图谱信息的方式无法完全利用图结构数据的空间结构信息,亟需一种新的可有效利用知识图谱信息的时序数据事件预测方法。
发明内容
本发明的目的在于提供一种基于图卷积神经网络的时序数据事件预测方法、系统及其应用,以解决上述存在的一个或多个技术问题。本发明中,通过构建包含时序数据及相关领域知识图谱的时间、空间图结构数据,再利用图卷积神经网络对数据进行建模,提取关键特征,进而进行事件预测,可弥补传统方法对数据数量及质量要求高、无法充分利用知识图谱的缺陷。
为达到上述目的,本发明采用以下技术方案:
本发明的一种基于图卷积神经网络的时序数据事件预测方法,包括以下步骤:
步骤1,采集预设数量的时序数据;对时序数据进行数据清洗,实现初始数据结构统一;
步骤2,将步骤1获得的数据清洗后的时序数据以预定的时间间隔转换成事件序列数据,获得事件与事件集合的向量表示;将事件序列数据中每一条序列样本数据最后一个时刻所包含的事件集合作为预测目标,将其作为对应序列样本标签,得到已标注的事件序列数据;将已标注的事件序列数据划分为训练集、验证集与测试集;
步骤3,根据步骤2获得的训练集、验证集与测试集,以及知识图谱,分别构建时间、空间图结构形式的训练集、验证集与测试集;
步骤4,使用步骤3获得的训练集训练预构建的图卷积神经网络模型,使用验证集验证训练效果并调整网络参数;其中,当图卷积神经网络模型被训练至满足预设定的收敛条件时,使用测试集对模型预测效果进行测试,取测试效果的模型作为最终的事件预测模型;
步骤5,将待预测序列数据输入步骤4获得的事件预测模型中,获得在某一时刻特定事件可能会发生的概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010124544.4/2.html,转载请声明来源钻瓜专利网。