[发明专利]一种基于计算机大数据存储系统有效

专利信息
申请号: 202010245566.6 申请日: 2020-03-31
公开(公告)号: CN111444187B 公开(公告)日: 2022-07-29
发明(设计)人: 郭均纺 申请(专利权)人: 温州大学
主分类号: G06F16/22 分类号: G06F16/22;G06F16/23;G06F16/248;G06F16/16;G06F16/31;G06F16/335;G06F16/338;G06F40/216;G06F40/289
代理公司: 深圳峰诚志合知识产权代理有限公司 44525 代理人: 李明香
地址: 325000 浙江省温州市瓯海*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 计算机 数据 存储系统
【权利要求书】:

1.一种基于计算机大数据存储系统,其特征在于,包括数据获取单元、数据解析单元、监控单元、人脸库、识别单元、处理器、访问请求单元、习惯积累单元、惯性库、显示单元、主存储单元、废弃存储单元和中转单元;

所述数据获取单元用于获取所有用户存储的日常数据,所述数据获取单元用于将日常数据传输到数据解析单元,所述数据解析单元接收数据获取单元传输的日常数据,并对日常数据进行初数据处理,得到日常数据及其对应的核心信息融合形成的存储数据;

所述数据解析单元用于将存储数据传输到处理器,所述处理器接收数据解析单元传输的存储数据并将其传输到主存储单元,所述主存储单元接收处理器传输的存储数据,并对其进行自存储步骤,自存储步骤具体如下:

S10:获取到存储数据及其时间戳;

S20:按照日、月、年,依次建立底层、次层和表层文件夹,底层文件夹内存储数据,底层文件夹存储在次层文件夹内,次层文件夹存储在表层文件夹内;

S30:之后获取到所有存储数据,并获取到存储数据内的核心信息,对所有核心信息进行关联性分析,得到若干以标志数据的关键词命名的存储文件夹内存储的标志数据和存储数据;

S40:完成自存储步骤;

其中,所述访问请求单元用于用户发起访问请求,访问请求包括请求信息和请求信号,请求信息为用户所需访问的目标内容的关键字;所述访问请求单元用于将访问请求传输到处理器,同时会将访问请求内的请求信号传输到识别单元;

所述监控单元为设置在对应用户录入请求信息的设备上,用于获取访问请求录入用于的访问面部信息,所述监控单元用于将访问面部信息传输到识别单元,所述识别单元接收监控单元传输的访问面部信息,所述人脸库内存储有核准访问用户的标准面部信息,所述识别单元用于将访问面部信息与人脸库内的标准面部信息进行比对,在比对到有访问面部信息一致的标准面部信息时,产生允通信号,所述识别单元用于将允通信号传输到处理器;

所述处理器只有在接收到识别单元传输的允通信号时,才会对访问请求单元传输的访问请求进行请求分析处理,具体处理步骤为:

步骤一:获取到访问请求内的请求信息;

步骤二:将请求信息与标志数据的标志信息和存储数据的核心信息,进行比对;

步骤三:将比对一致的字眼除以请求信息的总字数,得到相似占比;

步骤四:将相似占比超过X2的存储数据和标志数据均标记为可疑数据;X2为预设值;

步骤五:将可疑数据借助显示单元呈现给用户,供用户选择,进行访问,并将访问对象和次数融合形成访问记录;

所述习惯积累单元还用于对用户的访问记录进行访问分析,访问分析每天指定时间进行一次,得到存储在惯性库内的惯性词汇;

所述处理器在对访问请求内的请求信息进行请求分析处理的同时,还会进行联想推荐,联想推荐的内容为惯性库内的关键词相关的存储数据;所述处理器用于将联想推荐内容传输到显示单元进行显示;

所述中转单元还用于对主存储单元内存储的存储数据进行转废分析,具体分析步骤为:

S010:获取到所有存储数据对应的访问次数,依次将存储数据及其对应的访问次数标记为Ci和Fi,i=1...n;

S020:之后获取到存储数据最后一次访问距离当下的时间,将其标记为热度时间Ri,i=1...n;

S030:获取到存储数据的大小,将其标记为对象大小Di,i=1...n;且Ci、Fi、Ri和Di均为一一对应;

S040:求取存储数据的可选值Ki,Ki=(0.456*Fi+0.544*Ri)*Di,

i=1...n;

S050:将Ki值低于X5的对应存储数据Ci标记为转废数据,X5为预设值;

初数据处理的具体处理步骤为:

步骤一:首先用户需要对日常数据进行关键词录入,关键词为用户对该日常数据进行内容描述的词语;

步骤二:之后会自动对日常数据进行内容提取,内容提取步骤如下:

S1:首先,获取到日常数据的数据格式,当其为文本文件时;

S2:会获取到文本文件内的所有文本内容;

S3:对文本内容进行分词处理,得到由若干分词构成的文本内容;

S4:获取到每一个分词出现的次数,获取到次数最高的分词,若该分词的次数超过预设值;则对应将次数最高的分词标记为核词;

S5:若日常数据的文本格式不为文本文件时,则将核词标记为无;

步骤三:将对应日常数据的关键词、核词和日常数据的数据名称标记为核心信息;

步骤四:得到日常数据及其对应的核心信息,融合形成存储数据;

关联性分析的具体分析步骤为:

S31:当存储数据为第一个传入存储到底层文件夹内时,在底层文件夹内建立存储文件夹,将其核心信息内的关键词标记为存储文件夹的文件名,将对应存储数据存储到对应建立的存储文件夹内;

S32:将该存储数据标记为标志数据,将标志数据的核心信息标记为标志信息;

S33:在后续存储数据录入时,获取到后续录入的存储数据内的核心信息;

S34:获取到核心信息内所有的字眼,将其与标志信息内的字眼进行比对,获取到与标志信息内字眼一致的核心信息字眼的个数,将该个数标记为命中个数;

S35:将命中个数除以核心信息的总个数,得到命中占比;

S36:当命中占比大于X1时,则二者关联,将该存储数据存储到标志数据内的存储文件夹;X1为预设值;

S37:若不满足S36的内容时,则二者不关联,在不关联时,将该存储数据与其他的标志数据进行S34-S36步骤的比对,直到比对完所有的标志数据;若有则将其存储在对应的存储文件夹内,若均无,则转至下一步骤;

S38:将新的存储数据标记为新的标志数据,在底层文件夹内建立新的以该标志数据关键词命名的存储文件夹,将对应标志数据存储在存储文件内;

S39:重复获取到后续存入的数据,进行上述步骤S33-S39的步骤,直到对所有的存储数据处理完毕;得到若干以标志数据的关键词命名的存储文件夹内存储的标志数据和存储数据。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于温州大学,未经温州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010245566.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top