[发明专利]数据处理方法、装置、设备、介质和程序产品在审
申请号: | 202211043758.4 | 申请日: | 2022-08-29 |
公开(公告)号: | CN115687907A | 公开(公告)日: | 2023-02-03 |
发明(设计)人: | 李熠;杨晓然;邬子庄 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06F18/2135 | 分类号: | G06F18/2135;G06F18/23;G06F18/241 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 张琛 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 设备 介质 程序 产品 | ||
1.一种数据处理方法,其特征在于,包括:
获取原始数据,对所述原始数据进行预处理,获取待拆分视图数据,其中,所述待拆分视图数据为单视图数据;
基于主成分分析法对所述待拆分视图数据按照维度进行视图拆分,将所述待拆分视图数据转化为多视图数据;以及
基于所述多视图数据利用单视图算法或多视图算法建立模型,
其中,所述单视图数据为高维数据,所述高维数据中的维度与实体特征相对应;所述多视图数据为分配于多个视图的数据,其中,每个视图中的数据的维度数量相同或不同,各视图中的数据的维度数量的聚合等同于单视图数据的维度。
2.一种根据权利要求1所述的方法,其中,所述基于主成分分析法对所述待拆分视图数据按照维度进行视图拆分,将所述待拆分视图数据转化为多视图数据的步骤包括维度拆分的步骤,其中,所述维度拆分的步骤包括:
构造主成分分析分类指示函数,其中,所述主成分分析分类指示函数基于特征分类指示矩阵构建,所述特征分类指示矩阵为n×k的矩阵,其中,n为待拆分数据的维度,k为预设的视图拆分个数;
求解所述主成分分析分类指示函数的最优化问题,获取求解结果,其中,所述求解结果包括特征分类指示矩阵的权重分配结果,所述特征分类指示矩阵的权重分配结果为与所述视图拆分个数对应的最小特征值对应特征向量构成的矩阵;以及
基于所述特征分类指示矩阵的权重分配结果对所述待拆分视图数据的维度进行视图拆分,获取数据维度拆分结果,其中,所述待拆分视图数据的维度为m,其中,将第i个数据维度进行拆分包括:以及
将第i个数据维度拆分至特征分类指示矩阵中与所述第i个数据维度对应的特征向量中最大特征值对应的视图,其中,i∈[1,m]。
3.根据权利要求2所述的方法,其中,在获取m个维度数据的维度拆分结果后,所述方法还包括:
将所述待拆分视图数据按照维度拆分结果进行视图数据分配,获取所述多视图数据。
4.一种根据权利要求1所述的方法,其中,预设的视图拆分个数基于自动聚类算法或相似度算法中的一种对待拆分数据维度进行处理得到。
5.一种根据权利要求4所述的方法,其中,所述自动聚类算法包括基于密度的噪声应用空间聚类算法、模糊聚类算法、K均值聚类算法中的一种;和/或,所述相似度算法包括余弦相似度算法、距离相似度算法、皮尔逊相关系数中的一种。
6.一种根据权利要求1所述的方法,其中,所述对所述原始数据进行预处理包括:
对所述原始数据进行归一化处理。
7.一种根据权利要求2所述的方法,其中,所述求解所述主成分分析分类指示函数的最优化问题包括:
基于广义特征值求解方法求解所述主成分分析分类指示函数的最优化问题。
8.一种根据权利要求1所述的方法,其中,所述多视图算法包括典型相关分析,多典型相关分析,核典型相关分析,局部保持典型相关分析,判别典型相关分析,广义多视角分析,多视角判别分析,多视角降维模型中的一种。
9.一种根据权利要求1所述的方法,其中,所述原始数据包含用户特征数据,所述模型用于构建用户画像。
10.一种数据处理装置,包括:
获取模块,配置为获取原始数据,对所述原始数据进行预处理,获取待拆分视图数据,其中,所述待拆分视图数据为单视图数据,其中,所述单视图数据为高维数据,所述高维数据中的维度与实体特征相对应;
数据拆分模块,配置为基于主成分分析法对所述待拆分视图数据按照维度进行视图拆分,将所述待拆分视图数据转化为多视图数据,其中,所述多视图数据为分配于多个视图的数据,其中,每个视图中的数据的维度数量相同或不同,各视图中的数据的维度数量的聚合等同于单视图数据的维度;以及
模型建立模块,配置为基于所述多视图数据利用单视图算法或多视图算法建立模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211043758.4/1.html,转载请声明来源钻瓜专利网。