[发明专利]基于云存储平台的媒体数据高效访问预取方法在审
申请号: | 201410012896.5 | 申请日: | 2014-01-13 |
公开(公告)号: | CN104778010A | 公开(公告)日: | 2015-07-15 |
发明(设计)人: | 塔娜 | 申请(专利权)人: | 内蒙古近远信息技术有限责任公司 |
主分类号: | G06F3/06 | 分类号: | G06F3/06 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 010000 内蒙古自治区呼和浩*** | 国省代码: | 内蒙古;15 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 存储 平台 媒体 数据 高效 访问 方法 | ||
技术领域
本发明涉及数据传输技术领域,特别是一种基于云存储平台的媒体数据高效访问预取方法。
背景技术
随着云存储技术的发展,用户越来习惯于将自己的个人数据放在云端上,其中媒体数据占用了相当大的比例,包括JPG、PNG等格式的照片,MP3、WAV、APE等格式的音频文件以及AVI、MKV、RMVB等格式的视频文件。
与一般数据相比,媒体数据具有两个个重要的特点:1、读操作请求远远大于写操作请求,针对视频等大文件基本不存在写操作请求。用户习惯于直接在云端访问媒体数据,而不是通过某种方式下载到本地再访问。2、文件的访问序列存在一定的规律性,如视频的读取操作往往是顺序的。媒体数据的这些特点决定了为其设计专门高效访问框架的必要性,具体应包括预取和缓存技术的应用。
为了提高云端数据的访问效率,开发者一般采取预取和缓存策略相结合的方式。其中的关键在于维持一个滑动的窗口,提前将数据从服务器端下载下来并缓存。当有新的读请求发生时,若请求的数据范围落在预取的窗口内或者已经缓存的数据范围内,则本次请求就可以避免网络操作,直接从本地读取,从而将本次操作的时间开销降低了一个甚至几个数量级。采用这项技术的传统做法往往是在访问云端数据的客户端实现一个精妙的预取算法配合着缓存管理一起使用,从而达到提高数据访问速度的问题。鉴于用户操作的复杂性、文件类型的多样性以及预取无效的开销,在算法设计的时候人们往往从文件的底层访问序列出发,并试着用已有的底层访问信息预测下一次的读请求。然而这种做法存在着以下问题:一、首先由于算法是固定在客户端的,通用的,难以根据用户的个人情况给予调整和定制。二、为了尽可能的避免开销,只考虑底层文件访问序列并针对所有类型文件的通用识别框架往往只能分辨出特定情况下的读请求,使得一些本可预取的情况被忽略。因此,如何充分利用云环境下的文件特性、文件底层访问序列和用户信息提高访问云端媒体数据的效率是云存储领域需要解决的一个技术问题。
发明内容
本发明所要解决的技术问题是:在云存储环境下充分利用媒体数据的文件特性、文件底层访问序列和用户信息制定出高校的数据访问策略,提高用户访问速度和体验。为解决以上技术问题,本发明采用如下技术方案,一种基于云存储平台的媒体数据高效访问预取方法,其特征在于,包括:
步骤1.建立数据访问策略服务器,所述数据访问策略服务器包括序列分析模块和策略生产模块,所述序列分析模块和策略生产模块根据用户ID、文件类型和当前状态生产访问策略文件的服务;
步骤2.客户端初始化策略管理模块,根据用ID、文件类型向所述策略服务器请求访问策略;
步骤3.客户端解析策略文件,并根据解析后的策略文件初始化缓存管理、序列分析相关参数;
步骤4.客户端处理用户请求,并根据具体情况从缓存中读取数据或从服务器端读取数据,同时依据之前请求的策略决定向服务器端请求数据;
步骤5.打包上传本地文件访问日志。
步骤1中所述序列分析模块负责对以往操作日志的分析,所述操作日志包括用户上传的日志和开发者生产的没有跳跃情况下的的访问序列日志;在进行日志分析后,所述策略服务器生成针对每一类文件的相关参数,所述策略服务器按照文件后缀来进行区分;得到的相关参数包括文件分类、当前每次网络请求建议块大小、特殊预取区间和通用预取算法。
所述序列分析模块在分析过程中,用哈希表记录每次访问的位移空间,统计各个区间出现的频率和变化规律,如果某非连续区间出现10%以上则将其归为特殊预存空间。
所述特殊预取空间是一个四元组,包括开始位移、结束位移和建议预取开始位移和建议预取结束位移;当请求的位移落在特殊预取空间时将按照建议预取开始位移和建议预取结束位移进行预取,其中建议开始预取空间和建议结束预取空间为序列中本特殊空间的下一个元素。
客户端在收到访问文件请求后会检查本地是否存在该类后缀文件的访问策略,如不存在则会向策略服务器请求,在得到策略文件返回来的信息后,客户端会为该文件初始化缓存管理器即分配一个哈希表结构,其中key为位移,value为布尔值,这些key-value对全部存在内存当中。
所述通用预取算法主要针对顺序访问和交织访问,随机访问不在支持的访问内,其中顺序访问维持一个预取窗口而预取访问维持两个预取窗口。
所述预取窗口分为若干预取块,所述预取块大小是由策略服务器得到的日志中取该类型文件请求次数最多的数据块的大小决定。
步骤4的客户端处理用户请求,具体包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于内蒙古近远信息技术有限责任公司,未经内蒙古近远信息技术有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410012896.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:追踪对存储器的行的激活的方法和设备
- 下一篇:驱动方法及装置、显示装置