[发明专利]数据处理方法、装置、电子设备及可读存储介质有效

申请号：	202011560871.0	申请日：	2020-12-25
公开（公告）号：	CN112559574B	公开（公告）日：	2023-10-13
发明（设计）人：	刘朋	申请（专利权）人：	北京百度网讯科技有限公司
主分类号：	G06F16/2455	分类号：	G06F16/2455;G06F16/22;G06F18/214;G06N20/20
代理公司：	北京银龙知识产权代理有限公司 11243	代理人：	许静;黄灿
地址：	100085 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	数据处理方法装置电子设备可读存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开了一种数据处理方法、装置、电子设备及可读存储介质，涉及云计算技术领域和云存储技术领域。其中，所述数据处理方法包括：服务器响应于终端发送的对第一数据集的缓存预读请求，在所述第一数据集未被缓存的情况下，将所述第一数据集中的部分数据组的数据预读至服务器的缓存中。通过将数据集的不同数据组交给不同的服务器执行缓存和管理，可以保证不同服务器上执行不同数据的缓存，从而避免了多个服务器上缓存有相同数据的情况，能够提高缓存资源的利用率。

技术领域

本申请涉及云计算技术领域，尤其涉及云存储技术领域，具体涉及一种数据处理方法、装置、电子设备及可读存储介质。

背景技术

深度学习训练过程中，为了能够以随机的方式访问训练数据，深度学习训练框架会使用索引序列来反复遍历读取数据集。因而，通常通过高速缓存Cache来加快训练过程中的数据读取速度。

现有技术中，后端服务端通常部署有分布式缓存系统，分布式缓存系统的多台缓存服务器上可能缓存有大量相同的数据，使得缓存资源没有得到充分有效的利用，利用效率不高。

发明内容

本申请提供了一种数据处理方法、装置、电子设备及可读存储介质。

根据本申请的一方面，提供了一种数据处理方法，由服务器执行，所述方法包括：

接收终端发送的针对第一数据集的缓存预读请求，所述第一数据集包括M个数据组，M为正整数；

确定所述M个数据组中的N个数据组，N为小于M的正整数；

将所述N个数据组的数据预读至缓存中。

根据本申请的另一方面，提供了一种数据处理方法，由终端执行，包括：