[发明专利]结合大数据和多维特征的数据溯源方法及大数据云服务器在审
申请号: | 202110091866.8 | 申请日: | 2020-08-27 |
公开(公告)号: | CN112818067A | 公开(公告)日: | 2021-05-18 |
发明(设计)人: | 黄天红 | 申请(专利权)人: | 黄天红 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/22;G06F16/2455 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 650000 云南省昆明市经开*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 结合 数据 多维 特征 溯源 方法 服务器 | ||
1.一种结合大数据和多维特征的数据溯源方法,其特征在于,包括:
根据预设的数据特征识别模型对待溯源数据进行多维特征识别,得到与所述待溯源数据对应的多维数据特征队列;
其中:
待溯源数据是预先存储在大数据云服务器中的经过压缩的业务数据,该业务数据从业务终端中采集得到;
对所述多维数据特征队列进行数据环境参数聚类,得到所述待溯源数据的特征分布信息;
对所述待溯源数据的特征分布信息进行特征相关性识别,得到对应所述待溯源数据的相关性数据特征集;
对所述待溯源数据的特征分布信息进行数据交互缺损识别,得到对应所述待溯源数据的缺损数据特征集;
根据所述缺损数据特征集,对所述多维数据特征队列以及所述相关性数据特征集进行索引值提取,得到包括索引类别的目标索引值;
按照所述目标索引值及其所述索引类别在预设数据库中查询与所述待溯源数据对应的目标配对数据,并根据目标溯源数据对所述待溯源数据进行溯源得到所述待溯源数据对应的原始业务数据;
其中,预设数据库为MYSQL数据库或者Hive数据库。
2.根据权利要求1所述的方法,其特征在于,所述根据预设的数据特征识别模型对待溯源数据进行多维特征识别之前,还包括:对所述待溯源数据进行业务数据标签提取,得到所述待溯源数据的业务处理标签;
其中,所述根据预设的数据特征识别模型对待溯源数据进行多维特征识别,得到与所述待溯源数据对应的多维数据特征队列,包括:根据所述预设的数据特征识别模型中的预存标签信息集,对所述待溯源数据的业务处理标签进行数据特征和业务处理标签的遍历匹配,得到与所述待溯源数据对应的多维数据特征队列。
3.根据权利要求2所述的方法,其特征在于,所述根据所述预设的数据特征识别模型中的预存标签信息集,对所述待溯源数据的业务处理标签进行数据特征和业务处理标签的遍历匹配,得到与所述待溯源数据对应的多维数据特征队列,包括:
根据所述预设的数据特征识别模型中的预存标签信息集、以及所述待溯源数据的业务处理标签,确定用于将所述业务处理标签转换为所述预存标签信息集的标签映射路径;
根据所述标签映射路径对所述待溯源数据的业务处理标签进行路径节点分段映射,基于路径节点分段映射后得到的标签描述信息确定与所述待溯源数据对应的多维数据特征队列。
4.根据权利要求1所述的方法,其特征在于,用于数据环境参数聚类的目标聚类模型包括聚类驱动线程和聚类校正线程;
所述对所述多维数据特征队列进行数据环境参数聚类,得到所述待溯源数据的特征分布信息,包括:通过所述聚类驱动线程对所述多维数据特征队列进行基于特征维度数量的数据环境参数聚类,得到所述待溯源数据的特征分布信息;
所述对所述待溯源数据的特征分布信息进行特征相关性识别,得到对应所述待溯源数据的相关性数据特征集,包括:通过所述聚类校正线程对所述待溯源数据的特征分布信息进行基于聚类集集中度筛分的聚类集校正,得到对应所述待溯源数据的相关性数据特征集;
所述对所述待溯源数据的特征分布信息进行数据交互缺损识别,得到对应所述待溯源数据的缺损数据特征集,包括:通过所述聚类校正线程对所述待溯源数据的特征分布信息进行基于缺损曲线时序变化的聚类集校正,得到对应所述待溯源数据的缺损数据特征集。
5.根据权利要求4所述的方法,其特征在于,所述聚类校正线程包括多个存在递进关系的校正路径;所述通过所述聚类校正线程对所述待溯源数据的特征分布信息进行基于聚类集集中度筛分的聚类集校正,得到对应所述待溯源数据的相关性数据特征集,包括:
通过所述多个存在递进关系的校正路径中的第一个校正路径,对所述待溯源数据的特征分布信息进行特征分布区间校正;将所述第一个校正路径的校正输出信息传入到基于所述递进关系所确定出的下一个校正路径,以在所述基于所述递进关系所确定出的下一个校正路径中继续进行特征分布区间校正和校正输出信息输出,直至输出到最后一个校正路径,并将所述最后一个校正路径输出的校正输出信息映射至聚类特征列表,并基于最后一个校正路径输出的校正输出信息在所述聚类特征列表中的聚类集中度对应的集中度权重队列确定对应所述待溯源数据的相关性数据特征集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于黄天红,未经黄天红许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110091866.8/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置