[发明专利]一种数据集约化管理转分发的方法在审
申请号: | 202111427314.6 | 申请日: | 2021-11-29 |
公开(公告)号: | CN113850572A | 公开(公告)日: | 2021-12-28 |
发明(设计)人: | 李鲲;李永海 | 申请(专利权)人: | 泰德网聚(北京)科技股份有限公司 |
主分类号: | G06Q10/10 | 分类号: | G06Q10/10;G06F21/31;G06F21/57 |
代理公司: | 天津垠坤知识产权代理有限公司 12248 | 代理人: | 江洁;赵玉琴 |
地址: | 100024 北京市顺义区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 集约化 管理 分发 方法 | ||
本发明公开了一种数据集约化管理转分发的方法,本发明针对传统方法在检测离群点时常因冗余数据的干扰而导致检测用时较长、检测准确率偏低的问题,利用大规模数据集离群点检测算法,采用核主成分分析方法对大规模数据集进行降维处理,去除其中存在的冗余数据,该方法的检测时间始终低于0.4min,且检测准确率始终保持在90%以上,说明该算法能够快速、准确地检测大规模数据集中的离群点。
技术领域
发明数据集处理领域,尤其涉及一种数据集约化管理转分发的方法。
背景技术
相对于大量常规数据来说,数据集中存在的离群点是一种异常孤立的数据模式。通常情况下,数据集中存在的离群点会被作为噪声而被消除,但部分离群点中会存在一些重要的信息。离群点检测就是结合可视化、统计学、智能计算、机器学习等多种技术对数据集中存在的离群点进行识别, 便于后续的数据处理和分析。因为离群点中可能存在有效信息,因此离群检测在气象预测、预防电信诈骗、市场分析、医疗保险和预防信用卡欺诈等领域中得到了广泛的应用,具有重要的现实意义和学术意义。
现有的基于马氏距离的数据集离群点检测算法,该算法通过阶比重采样方法对大规模数据集中存在的原始数据进行预处理,并对数据进行量纲-因子分析,结合马氏距离采用多元线性归回方法构建离群点检测模型,实现对大规模数据集离群点的检测。然而因在大规欧模数据集下量纲-因子分析过程较为复杂,导致该算法转变数据形式所用的时间较长,存在检测效率低的问题。
发明内容
为了克服现有技术存在的缺点与不足,本发明提供一种数据集约化管理转分发的方法。
本发明所采用的技术方案是,包括数据装备功能模块、数据管理功能模块、数据应用功能模块;
所述数据装备功能模块对设备过去和现在的参数进行数据统计、归类、查询和输出,在不同生命周期内对设备的属性进行适当的分类,并在系统中进行重复查询和搜索使用;对于新购入设备以及设备的参数可以进行修改,对于改扩建工程根据工程内容,对设备参数进行更新,设备与工程需要进行关联,完成数据的流转,从而对工程和设备参数进行流程化管理;
所述数据管理功能模块,完成对数据模式定义、数据存取的物理构建、数据操纵、数据的完整性、安全性定义和检查、数据库的并发控制与故障恢复、数据的服务,根据不同的数据模式,将数据信息发送给调度中心,建立运行方式审查和实时监测平台,在此过程中,调用相关的设备和网络结构数据;
所述数据应用功能模块,该功能模块与调度系统进行接口,提供运行设备参数,设备参数以公共信息模型的标准格式进行输出,并且为其他的调度外系统进行设备参数查询和调用,外系统可以利用输出设备参数进行比对或导入,输出时可以按单个设备、所有设备、一类设备或某地区等条件进行设置。
进一步地,建立责任机制,从而管理人员或运维人员对自己的操作行为负责,包括应用日志记录和数字签名等技术手段进行抗抵赖设计;
(1) 日志记录
通过对用户行为记录日志,并采取措施保障日志信息的完整性;
(2) 数字签名
用户的所有操作行为进行数字签名,记录操作行为及操作时间。
进一步地,数据安全性防护,包括应用、操作系统和网络,是防止系统被篡改,或被注入病毒木马,或者恶意调整了系统结构,统一用户管理和身份认证、RBAC 授权管理与RBAC、统一加解密,跨区数据交互的主要安全基础设施如下:
(1)身份管理与身份认证基础设施;
(2)授权管理和 RBAC 基础设施;
(3)加密解密基础设施;
(4)系统安全管理、监控与审计基础设施。
进一步地,所述数据管理功能模块利用离群点检测算法对数据集进行降维处理,去除大规模数据集中存在的冗余数据,进而缩短离群点检测过程所需的时间;
输入空间中存在 N个数据,A代表样本对应的协方差,其表达式如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于泰德网聚(北京)科技股份有限公司,未经泰德网聚(北京)科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111427314.6/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置