[发明专利]一种大数据存储系统在审
申请号: | 201911309729.6 | 申请日: | 2019-12-18 |
公开(公告)号: | CN111078794A | 公开(公告)日: | 2020-04-28 |
发明(设计)人: | 任伟;蔡军杰;陆琴亚 | 申请(专利权)人: | 杭州桐硕教育科技有限公司 |
主分类号: | G06F16/27 | 分类号: | G06F16/27;G06F16/215;G06F21/62;G06F11/30 |
代理公司: | 合肥正则元起专利代理事务所(普通合伙) 34160 | 代理人: | 韩立峰 |
地址: | 311400 浙江省杭州市富阳区*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 存储系统 | ||
1.一种大数据存储系统,其特征在于,包括控制器,控制器连接有信息传输模块与若干个分布式数据库,分布式数据库数量可拓展,所述分布式数据库包括存储数据库与数据处理模块,所述信息传输模块连接有分级模块、阅览模块、信息评阅模块、访问模块与检索模块,所述分级模块连接有数据编录模块,所述控制器还连接有标识模块、暂存模块、自动检索模块、统计模块、验证模块与数据分类模块;
所述访问模块通过信息传输模块与控制器向验证模块传输访问认证信息,当访问认证信息通过验证模块的验证时,对应用户能够登录并对数据库中的数据进行访问查看;
所述验证模块用于对访问模块发出的访问认证信息进行验证,并对通过验证的账号登录状况进行监督;
所述标示模块用于生成账号并对账号标记,所标记账号分为高权限用户账号与普通权限用户账号,标记模块生成的账号分至各用户;
所述数据编录模块用于输入待存储数据,同时高权限用户能够通过数据编录模块对二级数据进行修改,数据编录模块中输入的待存储数据经分级模块设定权限后传输至暂存模块;
所述存储数据库用于存储数据编录模块输入的数据;
所述数据处理模块用于响应控制器的控制命令对存储数据库中的数据进行处理;
所述数据编录模块输入的待存储数据进入存储数据库的流程为:
步骤一:待存储数据传输至分级模块,分级模块将待存储数据分为一级数据与二级数据,其中一级数据为所有用户可发布、所有用户不可修改只可查阅的数据,二级数据为高权限用户可发布,所有用户可以查阅,高权限用户能够进行修改的数据;
步骤二:待存储数据传输至暂存模块,自动检索模块对待存储数据的标题进行检索,当待存储数据的标题中θ%的字符包含于分布式数据库中已经存储的数据A1、A2、......、An的标题中,则定义此待存储数据与已经存储的信息A1、A2、......、An为同一类数据,其中θ为预设值;
步骤三:控制器分析已经存储的数据A1、A2、......、An在分布式数据库中的分布状况,得到已经存储的数据A1、A2、......、An在各个分布式数据库中的存储数量B1、B2、......、Bn,取B1、B2、......、Bn中最小的存储数量Bk对应的分布式数据库Ck中,将该待存储数据传输至Ck中,若同时出现多个存储数量为Bk的分布式数据库C1、C2、......Cn,则待存储数据随机存储分布式数据库C1、C2、......Cn中的一个;
所述阅览模块用于查询阅览数据库中的现有数据;
所述信息评阅模块用于对数据库中的现有数据进行评价,评价分为赞同与不赞同,评价由接入存储系统的用户进行,每一个账号能够对一条数据信息进行一次评价;
所述数据分类模块用于对数据编录模块输入的数据按照所属检索领域进行分类,检索领域包括但不限于建筑、娱乐、军事、政治、社会与航天;
用户通过所述访问模块输入关键词对存储数据库中的数据进行检索与查看,访问模块的关键词信息传输入统计模块;
所述统计模块用于对一段时间内访问模块输入的关键词信息进行统计与分析,并将分析结果传输至自动检索模块;
所述自动检索模块用于对分布式数据库中的数据的标题与内容进行检索,并根据检索结果对冗余文件进行删除以释放存储数据库的存储空间;
所述冗余文件的删除方法为:
SS1、将检索领域分为R1、R2、......、Rn,预设每个检索领域的检索时间为T1、T2、......Tn,所述统计模块按照检索领域Rk每隔Tk时间对关键词信息进行统计,提取排名为Sk的关键词,其中1≤k≤n,且k为自然数,Tk与Sk均为预设值;
SS2、自动检索模块根据上一步骤中提取的关键词对存储数据库中的数据进行检索并提取,各个存储数据库中被提取的数据首先传输至数据处理模块,数据处理模块对其所在的分布式数据库内的被提取数据的标题与内容进行读取并进行相似度比较,当至少两个数据的相似度达到预设值ω%时,定义其为同一内容数据,每个检索领域的预设值ω%均不相同,且ω为预设值;
SS3、被定义为同一内容的数据之间根据X值与X1值进行比较,其中其中X1为数据的赞同的数量,X2为数据的不赞同的数量,X1≥X3,X3为设定数值,对同一内容的数据的X值进行比较并保留X值最大的数据Y1的以及X1值最大的数据Q1,X1≤X3的数据与其它不符合要求的冗余数据均从存储数据库中进行删除;
SS4、自动检索模块将各分布式数据库中得到的数据Y1、Y2、......Yn、Q1、Q2、......Qn后,对各数据的标题与内容进行读取并进行相似度比较,当至少两个数据的相似度达到预设值ω%时,定义其为同一内容数据,按照步骤SS3中的操作方法对冗余数据进行删除,其中ω为预设值。
2.根据权利要求1所述的一种大数据存储系统,其特征在于,所述访问模块与所述验证模块验证账号信息与账号登录状况的方法如下:
S1、访问模块在登录账号后向验证模块发出登录认证信息,验证模块接收到该登录认证信息后,向访问模块反馈第一验证信息,第一验证信息包括但不限于验证码,用于初步验证账号登录为计算机自动操作或真人操作;
S2、访问模块在接收到反馈的第一验证信息后,向验证模块发出链接申请信息,验证模块在接收到链接申请信息后向访问模块开放部分分布式数据库,开放的分布式数据库占分布式数据库的总数量比例不超过λ%,λ为预设值;
S3、验证模块在设定时间t内该登录账号对开放的分布式数据库内的检索次数G1,若G1<G2时,对该账号开放所有分布式数据库,G2为预设值,若G1≥G2,断开该账号与数据库的连接。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州桐硕教育科技有限公司,未经杭州桐硕教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911309729.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种锂离子电池三段式充电方法
- 下一篇:一种高效率视频拼接装置及方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置