[发明专利]跨域虚拟数据空间中文件数据边缘缓存方法有效
申请号: | 202010404811.3 | 申请日: | 2020-05-14 |
公开(公告)号: | CN111782612B | 公开(公告)日: | 2022-07-26 |
发明(设计)人: | 肖利民;徐耀文;秦广军;霍志胜;宋尧;周汉杰;王超波 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06F16/172 | 分类号: | G06F16/172;G06F16/174;G06F16/188 |
代理公司: | 北京海虹嘉诚知识产权代理有限公司 11129 | 代理人: | 吴小灿;张涛 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 虚拟 数据 空间 文件 边缘 缓存 方法 | ||
本发明提供一种跨域虚拟数据空间中文件数据边缘缓存方法,针对跨域虚拟数据空间中远程数据高效访问的需求以及广域环境给上层应用带来的IO瓶颈问题,提出了文件数据的边缘缓存机制。将远程数据缓存在靠近客户端的地方,建立边缘缓存,以提升上层应用访问远程数据的整体性能,并通过缓存共享,进一步减少数据冗余;边缘缓存针对小文件建立基于内存的文件缓存,针对大文件建立基于稀疏文件的文件系统缓存;采用基于文件扩展属性的中心读写标志的缓存策略,提升虚拟数据空间中数据的一致性;通过基于文件流行度的缓存替换策略,保证缓存的性能和效率。
技术领域:
本发明公开了一种跨域虚拟数据空间中文件数据边缘缓存方法,涉及广域高性能计算面临的挑战,属于计算机技术领域。
背景技术:
当前国家高性能计算环境中存储资源广域分散且隔离自治,大型计算应用迫切需要可支持跨域统一访问的全局虚拟数据空间,聚合广域分散自治存储资源形成跨域虚拟数据空间,实现存储资源全局统一管理和高效访问。目前已经完成虚拟数据空间模型的构建,设计并实现了虚拟数据空间基础软件系统。目前已经在中科院网络中心,广州超算中心,上海超算中心,济南超算中心和长沙超算中心等五个点进行部署测试。
跨域虚拟数据空间是一种广域文件系统,其客户端基于FUSE实现,支持以POSIX接口方式进行文件操作,客户端针对文件数据和空间信息进行缓存,数据缓存存在于异步写队列和预读窗口内,无缓存一致性开销,针对顺序读进行预读,无中长期缓存。管理节点维护全局统一名字空间,IO代理节点信息以及账户等相关管理信息。信息存放于各中心数据库中。各中心管理节点依靠数据库之间信息同步来保证全局管理信息最终一致。IO代理节点,负责传输文件数据和文件元数据,采用事件驱动以及线程池同步IO的方式,提供文件访问功能。
广域网环境具有低带宽、高时延、易抖动的特征。通信次数,通信带宽极大影响远程数据访问,通过缓存将活动数据放置到靠近客户端的地方,通过预取进行预加载数据,将进一步提高数据访问性能。当前虚拟数据空间客户端通过元数据缓存,数据预取和数据异步写机制,已经基本可以充分利用带宽。带宽利用率基本可以达到40%以上。假设广域网平均带宽为百兆带宽,封顶情况下顺序读写能达到12.5MB/s,随机读写速度则相对较少。然而在高性能计算环境下,局域网中的分布式文件系统(Lustre)或分布式块存储系统(Ceph)在千兆网环境下能提供约125MB/s的顺序访问速度,在万兆网络下,带宽则更高。广域网访问性能和局域网访问性能存在数量级的差异。缓慢的网络带宽,将大大限制上层计算应用的运行。即使在计算能随数据调度情况下,缓慢的网络IO依然是系统的瓶颈。而基于单客户端的缓存不能有效利用从远程超算中心获取的数据,将会出现同一中心客户端重复访问远程数据,导致了带宽的浪费。另一方面,客户端对网络较为依赖,而广域网具有高时延和易抖动的特征。因此针对于网络带宽过低,给上层应用IO带来的瓶颈问题,我们结合跨域虚拟数据空间实际应用场景下,提出边缘缓存的机制,将数据以文件粒度缓存在靠近客户端的地方,以提升上层应用访问数据的性能并减少网络波动或者网络中断对上层应用的影响。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010404811.3/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置