[发明专利]一种基于大数据的文件存储空间智能分配方法有效
申请号: | 201811117584.5 | 申请日: | 2018-09-21 |
公开(公告)号: | CN109299040B | 公开(公告)日: | 2019-07-05 |
发明(设计)人: | 方明权;蔡章利;蒋政 | 申请(专利权)人: | 重庆满集网络科技有限公司 |
主分类号: | G06F16/13 | 分类号: | G06F16/13;G06F16/17;G06F16/14 |
代理公司: | 重庆上义众和专利代理事务所(普通合伙) 50225 | 代理人: | 谭勇 |
地址: | 400020 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文件分析模块 数据信息 数据接入模块 控制器 文件存储空间 存储模块 信息传输 智能分配 大数据 数据信息传输 文件查询模块 备份存储 调用监控 记录模块 图片信息 文档信息 影像信息 调用 录入 存储 分类 分析 | ||
1.一种基于大数据的文件存储空间智能分配方法,其特征在于,包括数据接入模块、文件分析模块、文件查询模块、控制器、调用监控模块、限期存储模块、备份存储模块、调用记录模块和文件调转模块;
其中,所述数据接入模块用于用户录入数据信息用,所述数据接入模块用于将数据信息传输到文件分析模块,所述文件分析模块用于对数据信息进行分析,具体分析步骤如下:
步骤一:获取到数据信息,自动读取数据信息的后缀名;
步骤二:对后缀名进行识别,判断其文档类型;
S1:将数据信息划分为文档信息,文档信息包括所有的文本类文档文件;
S2:图片信息,图片信息包括所有格式的图片文件;
S3:影像信息,影像信息包括所有的音频、视频文件;
S4:其他信息,其他信息为除上述文档信息、图片信息和影像信息以外的信息;
步骤三:给上述各数据信息添加识别字眼;
S1:在文档信息名称前端添加识别字眼W;
S2:在图片信息名称前端添加识别字眼T;
S3:在影像信息名称前端添加识别字眼Y;
S4:在其他信息名称前端添加识别字眼Q;
所述文件分析模块用于将分类后的文档信息、图片信息、影像信息和其他信息传输到控制器;所述控制器接收文档分析模块传输的文档信息、图片信息、影像信息和其他信息,所述控制器用于将文档信息、图片信息、影像信息和其他信息传输到限期存储模块,所述限期存储模块接收控制器传输的文档信息、图片信息、影像信息和其他信息,所述限期存储模块用于根据文档信息、图片信息、影像信息和其他信息形成检索信息组并进行实时存储;所述检索信息组为限期存储模块存储的每一份数据信息的检索信息,检索信息用于用户在需要进行检索时用,检索信息包括检索关键词和路径信息;检索关键词为上述各数据信息的文件名称信息加简介信息,路径信息为对应数据信息的存储位置信息;所述文件查询模块用于用户在需要进行检索时候输入查询信息用;所述查询信息包括查询关键词和数据信息的识别字眼;查询关键词包括查询名称信息和查询简介,查询简介为用户自主输入;
所述文件查询模块用于将查询信息传输到控制器,所述控制器根据检索关键词自动从限期存储模块进行查询,查询过程如下:
步骤一:获取到查询信息内数据信息的识别字眼,根据识别字眼锁定数据信息的类型并将该类文档类型标记为锁定数据信息组;
步骤二:获取到查询信息内的查询名称信息,同时获取到锁定数据信息组内的检索信息组,之后获取对应检索信息组内检索信息的检索关键词,再之后获取检索关键词内的文件名称信息;将查询名称信息与文件名称信息进行比对;具体比对过程如下:
S1:将查询名称信息与文件名称信息进行逐字比对,获取到查询名称信息与文件名称信息的重叠率C1i,i=1...n;
S2:将C1i与预设值C1进行比对,获取所有大于C1的重叠率C1i对应的文件名称信息并将其标定为待确认文件名称信息组;
S3:获取到待确认文件名称信息组对应的简介信息组,获取到查询信息内的查询简介;
S4:将查询简介与简介信息组进行逐字比对,获取到查询简介与简介信息组的重合率C2i,i=1...n;
S5:将C2i按照由大到小的顺序进行排序,获取前三名重合率对应的简介信息并将其标定为待选择简介信息组;
步骤三:获取待选择简介信息组对应的检索信息内的路径信息组并将路径信息组标记为待选择路径信息组;
步骤四:根据待选择路径信息组内的三组路径信息获取到对应的数据信息组并将其标定为待选择数据信息组;
所述控制器用于将待选择数据信息组传输到显示模块进行实时显示,所述控制器用于将待选择数据信息组返回到文件查询模块用于用户输入目标数据信息,所述文件查询模块用于向控制器传输目标数据信息,所述控制器接收到目标数据信息并将目标数据信息传输到调用监控模块,所述调用监控模块用于将目标数据信息打上时间戳之后传输到调用记录模块,所述调用记录模块用于接收调用监控模块每一次传输的目标数据信息并进行下述处理:
步骤一:获取到接收到的所有目标数据信息最后一次的时间戳并将其标记为Ti,i=1...n;
步骤二:将Ti按照时间由近到远的顺序进行排序;
步骤三:并将Ti与当天时间进行比对计算得到距当天过去的时间信息Tji,i=1...n;
步骤四:按照Tji≤X1,X1<Tji<X2,Tji≥X2,将Tji划分为三个阶段;X1和X2均为预设值;并获取对应时间段的目标数据信息;
步骤五:将Tji≤X1时间段对应的目标数据信息标记为热门数据信息;
将X1<Tji<X2时间段对应的目标数据信息标记为常规数据信息;
将Tji≥X2时间段对应的目标数据信息标记为冷门数据信息;
所述调用记录模块用于将热门数据信息、常规数据信息和冷门数据信息融合形成调用信息,所述调用记录模块用于将调用信息传输到文件调转模块,所述文件调转模块用于将调用信息与限期存储模块内存储所有的数据信息进行比对,获取得到未调用过的数据信息并将其标记为转移信息;所述文件调转模块用于将转移信息从限期存储模块内调用出来并将其传输到备份存储模块,所述备份存储模块接收到文件调转模块传输的转移信息并将转移信息对应的检索信息删除形成备份存储信息,所述备份存储模块用于存储备份存储信息;
当所述控制器未从限期存储模块内查询到查询信息对应的数据信息时会自动查询备份存储模块内的数据信息,所述控制器用于根据查询信息内的查询名称信息从备份存储模块查找对应数据信息,当数据信息被查询后控制器会将其自动标记为目标数据信息并将其传输到调用监控模块;所述调用监控模块用于将目标数据信息打上时间戳传输到调用记录模块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆满集网络科技有限公司,未经重庆满集网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811117584.5/1.html,转载请声明来源钻瓜专利网。