[发明专利]一种基于机器学习的网络连接速度预测方法无效
申请号: | 200910102126.9 | 申请日: | 2009-08-13 |
公开(公告)号: | CN101634995A | 公开(公告)日: | 2010-01-27 |
发明(设计)人: | 徐颂华;江浩;金涛;刘智满;潘云鹤 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06N3/08;H04L12/26 |
代理公司: | 杭州求是专利事务所有限公司 | 代理人: | 张法高 |
地址: | 310027*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 机器 学习 网络 连接 速度 预测 方法 | ||
1.一种基于机器学习的网络连接速度预测方法,其特征在于包括以下步骤:
1)利用自定义浏览器,记录用户浏览过的网站连接速度,作为训练集和测试集;
2)利用获得的网站连接速度,使用神经网络训练并预测用户与训练集中各网站的连接速度;
3)根据神经网络的预测误差减小状况,或者执行步骤4),或者将训练集分成更小的训练集并对每个训练集返回执行步骤2);
4)使用决策树测试神经网络的预测性能;
5)使用决策树和神经网络,预测用户与任何未知网站的连接速度;
所述的利用自定义浏览器,记录用户浏览过的网站的连接速度,作为训练集和测试集步骤:
(a)对用户访问过的每个网站,记录每次用户向网站发出访问请求到用户获得回应的时间间隔,记为网站的用户连接时间;
(b)对用户访问过的每个网站,记录每次用户从网站下载数据时的下载速度,记为网站的用户带宽;
(c)若用户多次访问网站,则以最近一周中或最近10次的用户连接时间的平均值作为网站的用户连接时间,以最近一周中或最近10次的用户带宽的平均值作为网站的用户带宽;
(d)从用户历史数据中随机选择10%作为测试集,其余90%作为训练集;
所述的利用获得的网站连接速度,使用神经网络训练并预测用户与训练集中各网站的连接速度步骤:
(e)建立人工神经网络,其输入为一个网站的特征数据:包括一个表示为32位整数的网络IP地址和1个取值在0~23之间的整数用于表示当前时间的小时数;其输出为2个实数,分别表示用户与网站的连接时间估计值和带宽估计值;
(f)使用反向传播算法,用步骤(a)-(d)获得的用户连接时间和用户带宽历史数据作为训练集,使用反向传播算法训练步骤(e)所建立的神经网络,保存训练后的神经网络;
所述的根据神经网络的预测误差减小状况,或者执行步骤4),或者将训练集分成更小的训练集并对每个训练集返回执行步骤2)步骤:
(g)使用步骤(f)中训练后的神经网络预测在训练集中每个网站的用户连接时间和用户带宽,计算出网站的预测误差e:
e=t+Kb*b
其中t为用户连接时间的预测误差,单位为毫秒;b为用户带宽的预测误差,单位为千比特每秒;Kb为取值为200~1000的系数;
(h)若步骤(g)不是第一次被执行,且预测误差e总和与上一次预测误差总和相差不超过3%,则跳转执行步骤(k);
(i)将训练集中的网站数据按其在步骤(g)中的预测误差e从小到大排列,并使用k邻近聚类算法将网站分成m组,m为取值在1~5之间且使得各组间平均预测误差差别最大的整数;
(j)对步骤(i)中的每一组网站,将其作为训练集跳转执行步骤(e);
所述的使用决策树测试神经网络的预测性能步骤:
(k)将步骤(d)所获得的测试集中的网站按其网络IP地址分成1000组,编号为1~1000之间;设步骤(e)-(j)过程中最终使用了n个神经网络,记录其中每个站点在步骤(e)-(j)结束后其最后用于训练的神经网络编号,编号为1~n之间;
(l)建立一个决策树,其输入为取值为1~1000间的网络IP地址组编号,输出为取值为1~n的神经网络编号;
(m)利用步骤(d)所获得的测试集数据,使用C4.5决策树算法来训练步骤(l)中所建立的决策树,保存训练后的决策树;
所述的使用决策树和神经网络,预测用户与任何未知网站的连接速度步骤:
(n)对任意一个未知其连接速度的网站,按照步骤(k)所述获得其取值为1~1000之间的网络IP地址编号,并使用步骤(m)获得的决策树获得其对应的神经网络编号;
(o)使用其对应的神经网络,预测该网站的用户连接时间和用户带宽。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910102126.9/1.html,转载请声明来源钻瓜专利网。