[发明专利]数据降维方法、画像构建方法及系统、可读存储介质有效
申请号: | 201910592441.8 | 申请日: | 2019-07-03 |
公开(公告)号: | CN110991470B | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 季学伟;周轶;侯占杰;于富才;文明;刘艳;王博;尤秋菊;杨琳;刘耀峰;梅楠;叶飞 | 申请(专利权)人: | 北京市应急管理科学技术研究院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京东方芊悦知识产权代理事务所(普通合伙) 11591 | 代理人: | 彭秀丽 |
地址: | 101100 北京市通州区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 方法 画像 构建 系统 可读 存储 介质 | ||
本发明提供的数据降维方法、画像构建方法及系统、可读存储介质,其中的数据降维方法中,采用如下步骤:(1)确定映射关系;(2)定义核函数和核矩阵;(3)构造拉格朗日函数;(4)计算比例系数;(5)得到降维时的投影向量,从而实现数据降维;(6)得降维后的数据样本和;(7)计算样本中和的关联程度;(8)计算任意节点的传播能力;(9)计算节点的度,并构建了复杂网络。本发明采用了将复杂网络(CN)与核典型关联分析(KCCA)的方式,融合了二者的优势,弥补了各自的不足之处,采用数据降维等大数据分析方法,剔除了冗余数据,并着重考虑了系统间的关联性。采用本发明提供的以上技术方案,建立企业安全生产画像构建方法是有效的,为我国各企业调整产业结构、强化监管工作重点提供了准确的分析依据。
技术领域
本发明涉及机器学习与数据挖掘技术领域,具体涉及一种数据降维方法、画像构建方法及系统、可读存储介质。
背景技术
目前针对企业安全生产画像构建问题,大多数都是针对单一企业或者用户,在对规模以上企业安全生产构建画像方面的研究涉及较少。而且在对单一企业用户进行画像构建时,不用考虑用户之间的关联性信息以及安全生产等因素,因此不涉及多个个体的问题,而且这种画像构建更偏重应用推荐方面,不用考虑后续的安全生产状态监管问题。而在刻画规模以上企业安全生产画像时,往往需要考虑企业自身各项基本指标和其他一些外部影响因素,尤其是和安全生产相关的指标,这些指标和因素并不相互孤立,而是存在一种催生、转换、抵制等多种关系,这些关系会构成一个复杂网络。由于是对规模以上的企业构建画像,所以每个安全生产影响因素数据巨大,而这些因素都在不同程度上反映了所研究问题的某些信息,但实际上所得数据反映的信息在一定程度上存在重复和冗余,因此需要提供一种画像方法以解决上述问题。
发明内容
本发明实施例旨在提供一种数据降维方法、画像构建方法及系统、可读存储介质,以解决现有技术对大规模企业安全生产画像时存在的数据重复和冗余的技术问题。
本发明提供一种数据降维方法,包括如下步骤:
选择用于实现画像构建的数据样本,所述数据样本隶属于不同系统;
确定画像构建维度,构建样本矩阵,所述样本矩阵中的行数等于数据样本的数量,所述样本矩阵的列数等于维度数量;
选择任意两个样本矩阵,确定二者的映射关系;
根据所述映射关系得到样本矩阵的核函数和核矩阵;
根据所述核函数和核矩阵构造拉格朗日函数;
根据所述拉格朗日系数得到降维时的投影向量,得到降维后的数据样本。
可选地,上述的数据降维方法中,所述选择任意两个样本矩阵,确定二者的映射关系的步骤中,通过以下方法计算映射关系:
ΦX(X)=(ΦX(X1),...,ΦX(XN));
ΦY(Y)=(ΦY(Y1),...,ΦY(YN));
其中,X、Y为两组样本矩阵,Xp×N=(X1,...XN),Yq×N=(Y1,...,YN);ΦX、ΦY表示作用于X、Y上的变换,变换后为n×N维矩阵;
p表示样本X中的数据样本量;q表示样本Y中的数据样本量;N表示维度的数量。
可选地,上述的数据降维方法中,所述根据所述映射关系得到样本矩阵的核函数和核矩阵的步骤中,通过以下方法计算核函数和核矩阵:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市应急管理科学技术研究院,未经北京市应急管理科学技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910592441.8/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置