[发明专利]面向虚拟化软件流式加载的预取方法和系统有效
申请号: | 201010592125.X | 申请日: | 2010-12-08 |
公开(公告)号: | CN102033769A | 公开(公告)日: | 2011-04-27 |
发明(设计)人: | 沃天宇;李建欣;郑海兵;钟亮 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06F9/445 | 分类号: | G06F9/445;G06F9/455 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 华泽珍 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 虚拟 软件 加载 方法 系统 | ||
1.一种面向虚拟化软件流式加载的预取方法,其特征在于,包括:
获取与虚拟化软件使用过程中的文件访问对应的日志信息,所述日志信息中包括所访问文件的文件路径名,所述虚拟化软件使用过程中获取的多个日志信息组成一个日志文件;
对所述日志文件进行数据挖掘,得到所述虚拟化软件的预取规则表,所述预取规则表中包括分别与所述日志文件中的各长度小于等于设定长度的序列串对应的多个预取规则,所述预取规则包括所述序列串及其概率值;所述序列串包括连续的多个文件;
当终端用户请求访问所述虚拟化软件中的文件时,获取所述预取规则表中的目标预取规则,并将所述目标预取规则中的序列串的所有文件均从软件服务器下载至本地;所述目标预取规则的序列串中的首个文件为所访问的文件,并且所述目标预取规则的序列串的长度和概率值均为最大。
2.根据权利要求1所述的面向虚拟化软件流式加载的预取方法,其特征在于,所述对所述日志文件进行数据挖掘之前,还包括:对所述日志文件进行预处理,将所述日志文件转化为序列串;
包括:根据文件索引表将所述日志文件的日志信息中的文件路径名映射为数字标识,所述文件索引表中包括所述虚拟化软件中的所有文件以及分别与所述文件对应的数字标识;在所述映射完成后,去掉所述日志文件中重复的所述数字标识。
3.根据权利要求1或2所述的面向虚拟化软件流式加载的预取方法,其特征在于,所述对所述日志文件进行数据挖掘包括:
计算所述日志文件中的所述序列串出现的次数,并根据频率替换和条件概率原理得到各所述序列串的概率值。
4.根据权利要求3所述的面向虚拟化软件流式加载的预取方法,其特征在于,所述条件概率中的历史文件的个数为设定长度减1。
5.根据权利要求1所述的面向虚拟化软件流式加载的预取方法,其特征在于,对所述日志文件进行数据挖掘,具体为:
获取到的对应同一虚拟化软件的所述日志文件的数量大于设定阈值时,对所述日志文件进行数据挖掘,对所述虚拟化软件对应的预取规则表进行更新。
6.根据权利要求1所述的面向虚拟化软件流式加载的预取方法,其特征在于,在将所述目标预取规则中的序列串的所有文件均从软件服务器下载至本地之前,还包括:
根据所述预取规则表建立一哈希表。
7.一种面向虚拟化软件流式加载的预取系统,其特征在于,包括预取客户端和预取服务器;所述预取客户端包括数据收集模块和数据预取模块,所述预取服务器包括数据挖掘模块和存储模块;
所述数据收集模块,用于获取与虚拟化软件使用过程中的文件访问对应的日志信息,所述日志信息中包括所访问文件的文件路径名,所述虚拟化软件使用过程中获取的多个日志信息组成一个日志文件;
所述数据挖掘模块,用于对所述日志文件进行数据挖掘,得到所述虚拟化软件的预取规则表,所述预取规则表中包括分别与所述日志文件中的各长度小于等于设定长度的序列串对应的多个预取规则,所述预取规则包括所述序列串及其概率值,所述序列串包括连续的多个文件;
所述存储模块,用于存储所述预取规则表;
所述数据预取模块,用于当终端用户请求访问所述虚拟化软件中的文件时,获取所述预取规则表中的目标预取规则,并将所述目标预取规则中的序列串的所有文件均从软件服务器下载至本地;所述目标预取规则的序列串中的首个文件为所访问的文件,并且所述目标预取规则的序列串的长度和概率值均为最大。
8.根据权利要求7所述的面向虚拟化软件流式加载的预取系统,其特征在于,所述数据挖掘模块包括;
预处理单元,用于根据文件索引表将所述日志文件的日志信息中的文件路径名映射为数字标识,所述文件索引表中包括所述虚拟化软件中的所有文件以及分别与所述文件对应的数字标识;在所述映射完成后,去掉所述日志文件中重复的所述数字标识。
9.根据权利要求7或8所述的面向虚拟化软件流式加载的预取系统,其特征在于,所述数据挖掘模块,还包括:
更新单元,用于在获取到的对应同一虚拟化软件的所述日志文件的数量大于设定阈值时,对所述日志文件进行数据挖掘,对所述虚拟化软件对应的预取规则表进行更新。
10.根据权利要求7所述的面向虚拟化软件流式加载的预取系统,其特征在于,所述数据预取模块,还用于根据所述预取规则表建立一哈希表。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010592125.X/1.html,转载请声明来源钻瓜专利网。