[发明专利]一种基于循环神经网络的数据库查询时间预测方法有效
申请号: | 201710647281.3 | 申请日: | 2017-08-01 |
公开(公告)号: | CN107491508B | 公开(公告)日: | 2020-05-26 |
发明(设计)人: | 伍赛;毕里缘;陈珂;陈刚;寿黎但;胡天磊 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F16/2453 | 分类号: | G06F16/2453;G06F16/2455 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 林超 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 循环 神经网络 数据库 查询 时间 预测 方法 | ||
1.一种基于循环神经网络的数据库查询时间预测方法,其特点在于:所述方法的具体步骤如下:
(1)首先从数据库历史查询记录中抽取出查询计划构成原始数据,一条查询计划包含了多个操作及其对应的运行时间;
(2)按照查询计划的运行时间长短将原始数据分类,使得每类中包含的查询计划的数量相等;
(3)对查询计划进行特殊处理获得操作序列,并将查询计划中的所有运行时间按照操作序列中的顺序对应排列组成运行时间序列;
所述步骤(3)具体采用如下方式将一个查询计划处理成特定格式:对于一个查询计划中的各个操作,经过后序遍历生成操作序列;遍历生成操作序列时,对于查询计划中的各个操作提取关键特征,将每个操作转换成一个向量v,向量包含五个部分,第一部分n1代表操作的类型,第二部分n2代表操作在数据库中指定对应的源表,第三部分n3代表操作在数据库中指定对应源表的列,第四部分n4代表操作对应输出结果的平均宽度,第五部分n5代表操作在数据库中对应数据的分布情况;
所述步骤(3)用一个操作序列Sop={v0,...,vm}表示一个查询计划的操作信息,vi是操作序列Sop中第i个操作对应的向量,m表示查询计划中操作的总数;
(4)将操作序列作为特征向量和运行时间序列作为标签,输入神经网络训练并得到模型;
(5)针对待测的查询计划,重复步骤(3)获得其对应的操作序列,再输入到步骤(4)获得的神经网络模型中,输出与操作序列对应的运行时间序列,完成数据库查询时间的预测。
2.根据权利要求1所述的一种基于循环神经网络的数据库查询时间预测方法,其特征在于:所述步骤(4)中,神经网络模型的第一层是输入层,中间两层是隐层,最后一层是输出层,两层隐层结构均为LSTM层,隐层所用的激活函数是sigmoid,输出层的激活函数是softmax,两个隐层都是100个节点,损失函数是交叉熵代价函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710647281.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:维护推送信息的方法及装置
- 下一篇:一种用户属性信息挖掘方法、装置和介质