[发明专利]数据优化处理方法、装置、计算机设备及存储介质在审
申请号: | 201910319395.4 | 申请日: | 2019-04-19 |
公开(公告)号: | CN110175170A | 公开(公告)日: | 2019-08-27 |
发明(设计)人: | 陈健鹏 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/28 |
代理公司: | 深圳众鼎专利商标代理事务所(普通合伙) 44325 | 代理人: | 黄章辉 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基础特征 分析数据 目标矩阵 特征编码 特征量化 计算机设备 存储介质 数据优化 特征数据 二进制编码方式 关联存储 量化处理 数据库 创建 | ||
本发明公开一种数据优化处理方法、装置、计算机设备和存储介质,该方法包括获取特定领域的至少两个待分析数据,每一待分析数据中包含至少两个基础特征和与基础特征对应的原始特征值;对至少两个待分析数据中同一基础特征对应的原始特征值进行量化处理,获取每一基础特征对应的特征量化条件;根据特征量化条件和待分析数据中每一基础特征对应的原始特征值,采用二进制编码方式进行编码,获取基础特征对应的特征编码值;基于基础特征、特征量化条件和特征编码值,创建与特定领域对应的目标矩阵;根据目标矩阵中每一行特征编码值,获取待分析数据对应的特征数据,将特征数据和目标矩阵关联存储在与特定领域相对应的数据库,提高运行速度。
技术领域
本发明涉及数据处理技术领域,尤其涉及一种数据优化处理方法、装置、计算机设备及存储介质。
背景技术
随着全球经济的发展,各个企业之间的竞争日益激烈,各大企业通过待分析数据进行数据分析,以通过数据分析结果提取有用信息,拓展潜在的业务或新客户。其中,对待分析数据进行数据分析时,通常需要对待分析数据进行预处理,如进行特征化和归一化处理等,若待分析数据的数据量巨大,则会导致数据分析的运行速度变慢。
发明内容
本发明实施例提供一种数据优化处理方法、装置、计算机设备及存储介质,以解决数据分析的运行速度变慢的问题。
一种数据优化处理方法,包括:
获取特定领域的至少两个待分析数据,每一所述待分析数据中包含至少两个基础特征和与所述基础特征对应的原始特征值;
对至少两个所述待分析数据中同一所述基础特征对应的原始特征值进行量化处理,获取每一所述基础特征对应的特征量化条件;
根据所述特征量化条件和所述待分析数据中每一所述基础特征对应的原始特征值,采用二进制编码方式进行编码,获取所述基础特征对应的特征编码值;
基于所述基础特征、所述特征量化条件和所述特征编码值,创建与所述特定领域对应的目标矩阵;
根据所述目标矩阵中每一行所述特征编码值,获取所述待分析数据对应的特征数据,将所述特征数据和所述目标矩阵关联存储在与所述特定领域相对应的数据库。
一种数据优化处理装置,包括:
数据获取模块,用于获取特定领域的至少两个待分析数据,每一所述待分析数据中包含至少两个基础特征和与所述基础特征对应的原始特征值;
特征量化条件获取模块,用于对至少两个所述待分析数据中同一所述基础特征对应的原始特征值进行量化处理,获取每一所述基础特征对应的特征量化条件;
特征编码值获取模块,用于根据所述特征量化条件和所述待分析数据中每一所述基础特征对应的原始特征值,采用二进制编码方式进行编码,获取所述基础特征对应的特征编码值;
目标矩阵获取模块,用于基于所述基础特征、所述特征量化条件和所述特征编码值,创建与所述特定领域对应的目标矩阵;
存储模块,用于根据所述目标矩阵中每一行所述特征编码值,获取所述待分析数据对应的特征数据,将所述特征数据和所述目标矩阵关联存储在与所述特定领域相对应的数据库。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述数据优化处理方法。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述数据优化处理方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910319395.4/2.html,转载请声明来源钻瓜专利网。