[发明专利]一种基于数据简并的大数据转换方法与装置有效

专利信息
申请号: 202111029797.4 申请日: 2021-09-03
公开(公告)号: CN113470831B 公开(公告)日: 2021-11-16
发明(设计)人: 曾承 申请(专利权)人: 武汉泰乐奇信息科技有限公司
主分类号: G16H50/70 分类号: G16H50/70;G06K9/62
代理公司: 北京集智东方知识产权代理有限公司 11578 代理人: 吴倩;龚建蓉
地址: 430223 湖北省武汉市东湖新技术*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 数据 转换 方法 装置
【说明书】:

本申请揭示了一种基于数据简并的大数据转换方法,分别进行模数转化处理,以得到数字信号集合;进行聚类处理,以得到多个数据子集,并得到多个相似度集合;获取多个标准数据;生成多个虚拟数字数据,并对所述多个虚拟数字数据进行人工标记处理,从而得到多个样本数据;对预设的深度神经网络模型进行训练,以得到数字规律预测模型;得到多个预测结果;构成一号数据集,构成二号数据集;分别进行哈希计算,从而得到多个哈希值,并建立映射关系;进行数据简并处理,以得到多个三元素数据组合;执行大数据存储操作,实现了数据简并的目的,从而减轻了大数据的存储压力,并且还提高了大数据的信息安全性。

技术领域

本申请涉及到大数据领域,特别是涉及到一种基于数据简并的大数据转换方法与装置。

背景技术

医疗及医学教育领域中的大数据分析,是在大量的传感器进行大数据采集的基础上实施的,这些传感器采集得到的数据(一般为模拟信号数据)数量繁多,需要耗费大量的存储资源来存储,因此形成庞大的存储压力。而传统的大数据存储方案中,未能有效解决存储压力大的问题。

发明内容

本申请一种基于数据简并的大数据转换方法,应用于大数据转化终端,包括:

S1、接收来自于预设的多个数据传感器进行感测处理而得到的模拟信号集合,并根据预设的模数转化方法,对所述模拟信号集合中的模拟信号分别进行模数转化处理,以得到数字信号集合;

S2、根据预设的数据聚类方法,对所述数字信号集合进行聚类处理,以得到多个数据子集,并根据预设的相似度计算方法,对每个数据子集中的全部成员进行相似度计算处理,以得到与所述多个数据子集分别对应的多个相似度集合;

S3、根据所述多个相似度集合,从每个数据子集中分别筛选出一个标准数据,从而获取与所述多个数据子集一一对应的多个标准数据,并生成所述多个标准数据分别对应的代号;

S4、采用预设的数据模拟方法,生成多个虚拟数字数据,并对所述多个虚拟数字数据进行人工标记处理,以将存在数字规律的虚拟数字数据标记上对应的标签,从而得到多个样本数据;其中,不存在数字规律的虚拟数字数据被默认标记上零号标签,具有不同数字规律的虚拟数字数据被标记上不同的标签;

S5、使用所述多个样本数据对预设的深度神经网络模型进行训练,以得到数字规律预测模型;其中,训练过程中采用反向传播算法来更新各层网络的参数;

S6、将所述数字信号集合中,除所述多个标准数据之外的其他数据,依次输入所述数字规律预测模型中进行处理,以得到所述数字规律预测模型对应输出的多个预测结果;其中,当预测结果为具有数字规律时,预测结果还附带有数字规律标签;

S7、将预测结果为不具有数字规律的数据构成一号数据集,并将预测结果为具有数字规律的数据构成二号数据集;

S8、根据预设的哈希算法,对所述二号数据集中的所有数据分别进行哈希计算,从而得到多个哈希值,并建立数据-哈希值-数字规律标签-数据子集-标准数据代号的映射关系;

S9、根据所述映射关系,对所述二号数据集中的所有数据进行数据简并处理,以得到多个三元素数据组合;其中,每个三元素数据组合由处于同一个映射关系中的哈希值、数字规律标签和标准数据代号构成;

S10、执行大数据存储操作,以存储所述一号数据集、所述多个标准数据和所述多个三元素数据组合。

进一步地,所述根据预设的相似度计算方法,对每个数据子集中的全部成员进行相似度计算处理,以得到与所述多个数据子集分别对应的多个相似度集合的步骤,包括:

S201、进行第一次划分操作,以对第一个数据子集中的全部成员分别进行t等分划分处理,从而对应得到多个二进制符号段序列;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉泰乐奇信息科技有限公司,未经武汉泰乐奇信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111029797.4/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top