[发明专利]一种基于访问频度变长逻辑分段的数据分发方法有效

专利信息
申请号: 200910085125.8 申请日: 2009-06-02
公开(公告)号: CN101645888A 公开(公告)日: 2010-02-10
发明(设计)人: 王劲林;尤佳莉;王玲芳;李廷屹;邓浩江 申请(专利权)人: 中国科学院声学研究所
主分类号: H04L29/06 分类号: H04L29/06;H04L29/08;H04L12/56;H04L1/00
代理公司: 北京法思腾知识产权代理有限公司 代理人: 杨小蓉
地址: 100190北京市海淀区*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 访问 频度 变长 逻辑 分段 数据 分发 方法
【说明书】:

技术领域

发明涉及信息技术领域,特别涉及到由分布式节点组成的内容分发网络技术 领域中的一种基于访问频度变长逻辑分段的数据分发方法。

背景技术

CDN的全称是Content Distribution/Delivery Network,即内容分发网络。其目的 是通过在现有的Internet中增加一层新的网络架构,即提供透明服务的中间层,将网 站的内容发布到最接近用户的网络边缘,从而使得用户能以最快的速度,从最接近 用户的地方获得所需的信息,一方面,CDN可以减少延迟,解决Internet网络拥挤 的状况;另一方面,还可以有效实现多种宽带应用,提高响应速度和服务质量,特 别是在流媒体传输方面有着其它技术无可比拟的优势。

在CDN系统中,为了使用户快速取得数据,一个文件常常被生成多个副本,散 落的放置于网络中,如何对这些副本进行合理地生成和维护,则是CDN系统的重要 问题。P2P技术由于其自组织、负载均衡等优势,受到了广泛的关注,也越来越多的 被应用在CDN的研究中。

结构化P2P网络又称为分布式哈希表(简称DHT),每个节点都通过某种哈希 算法得到一个唯一ID值,所有应用实体(如对象,object),也通过该哈希算法得到 一个与节点ID在同一个数值空间的object ID值,同样也有一个唯一的放置节点,该 放置节点就叫做该object的主节点,称作home node。对object的查找即对其home node的定位,该过程是通过查询发起节点的邻居作为中介而逐跳进行的,直至找到 目标或查找失败为止。在DHT网络中,假设哈希值的ID空间为M个bit位的数值, 从左到右,所有匹配大于等于1位数值的ID,称为在一个等级,即一个level。一个 object如果其level为1,表示平均路由1跳就可以找到该object,因此,需要在1跳 覆盖之外的所有节点上对该数据进行备份。以Pastry为路由协议为例,object的level 为1则对应了一个楔形的节点区域,表示该区域的所有节点需要对object进行备份, 若网络中节点总数为N,基数为b,则需要N/b1个节点进行备份。因此,如何计算每 个object所对应的level值,则是副本放置的关键。

文件的流行度是指一个文件受用户的欢迎程度,以用户对该文件的访问频率来 表示,比如被用户点播、下载的次数等。在CDN系统中,常常根据每个文件流行度 的不同来计算文件的副本等级数,生成对应副本并放置于网络中。实际中,大多数 的CDN主要对流媒体等大文件进行分发和存储,而通过视频点播等系统的研究发现, 尽管一个文件被点播了多次,但用户在整个文件时间域上的访问行为并不是平均分 布的。以电影为例,用户对文件的开头和结尾更感兴趣,而常常跳过对中间内容的 观看。同时,长度短的影片和长的影片也具有不同的访问规律。文件的时域访问特 征可以通过长时间积累的历史访问数据进行拟合得到,许多数值分析的相关方法可 以应用,这里不再赘述。因此,根据流行度信息对大文件整体进行副本生成,并不 符合用户的实际需求,同时,会导致大量存储空间被不常被访问的数据占用。

综上所述,可知一个文件在时间域上的用户行为特征,对正确放置数据副本有 着重要意义。

发明内容

为了解决上述问题,本发明的目的在于提供一种基于访问频度变长逻辑分段的 数据分发方法。该方法将文件切分成细粒度的单元,基于用户在文件不同时间段上 访问频度的差异,为文件生成变长逻辑分段,针对不同逻辑分段分别进行基于流行 度(即频度)的多副本放置,使数据在CDN网络中的副本分布更加符合用户的实际 访问习惯。同时,细粒度的文件切片,使得用户访问行为的统计更加精准,便于对 用户访问频度特征基于时间变化的更新,并应用于内容分发的副本生成上,使系统 中的数据分布自适应的随时间进行调整。另外,多级索引的应用,有效降低了数据 副本等级调整时所带来的通信开销,提高了系统性能。

为达到上述目的,本发明提供一种基于访问频度变长逻辑分段的数据分发方法, 对于分发到网络中的文件f,分发过程如下:

1)将文件切分为大小相等的小数据块(Unit Block,简称ub)序列 {ub1,ub2,...,ubn}。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所,未经中国科学院声学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200910085125.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top