[发明专利]特征挖掘组合方法、装置、设备及计算机可读存储介质在审
申请号: | 202011490106.6 | 申请日: | 2020-12-16 |
公开(公告)号: | CN112508119A | 公开(公告)日: | 2021-03-16 |
发明(设计)人: | 俞静;姚晨钰;周彦霖 | 申请(专利权)人: | 平安银行股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 魏润洁 |
地址: | 518000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征 挖掘 组合 方法 装置 设备 计算机 可读 存储 介质 | ||
本发明涉及机器学习,提供一种特征挖掘组合方法、装置、设备及可读存储介质。本发明通过直接获取底层数据,并基于此进行一系列处理后最终得到目标模型组合,使得能够支持从底层数据开始进行特征挖掘;通过当前所确定的特征基元构造目标特征集合,再结合已有的特征集合构建并训练特征模型矩阵,使得原先独立的特征挖掘模块与模型训练模块能够联动执行,实现了特征挖掘模块与模型训练模块之间的融合;通过从训练得出的特征模型矩阵中确定出适配当前场景的目标模型组合,使得能够根据实际场景推荐最佳的模型组合。此外,本发明还涉及区块链技术,上述底层数据可存储于区块链中。
技术领域
本发明涉及机器学习技术领域,尤其涉及一种特征挖掘组合方法、装置、设备及计算机可读存储介质。
背景技术
随着机器学习技术的快速发展,机器学习技术被广泛应用于各行业的数据分析过程中,为人们带来了极大的便利。目前人们通常会采用一些集成有数据特征处理相关功能的机器学习平台对传入的大量数据进行处理,以通过这些平台进行特征构造进而训练实际所需的特征模型。但在目前,这些产品往往还存在着:平台中的特征挖掘和模型训练模块相互独立,模型训练涉及的特征挖掘无法支持从底层数据开始进行特征挖掘,无法提供自动适配当前情境的特征组合等等问题。上述种种情况均反映出现有的特征挖掘平台存在较大的功能局限性的技术问题。
发明内容
本发明的主要目的在于提供一种特征挖掘组合方法、装置、设备及计算机可读存储介质,旨在解决现有的特征挖掘平台存在较大的功能局限性的技术问题。
为实现上述目的,本发明提供一种特征挖掘组合方法,所述特征挖掘组合方法包括:
获取底层数据,并根据所述底层数据生成若干标准数据表;
基于若干所述标准数据表确定特征基元,并根据所述特征基元构造若干所述标准数据表的目标特征集合;
基于所述目标特征集合与预设已有特征集合构建并训练特征模型矩阵,以从所述特征模型矩阵中确定出适配于当前场景的目标模型组合。
可选地,所述特征基元包括第一特征基元与第二特征基元,
所述基于若干所述标准数据表确定特征基元,并根据所述特征基元构造若干所述标准数据表的目标特征集合包括:
获取第一特征基元,并利用所述第一特征基元构造若干所述标准数据表的初始特征;
识别所述初始特征的特征类型,并根据所述特征类型确定第二特征基元,以利用所述第二特征基元对所述初始特征进行特征衍生得到衍生特征;
结合所述初始特征与所述衍生特征,得到若干所述标准数据表的目标特征集合。
可选地,所述获取第一特征基元,并利用所述第一特征基元构造若干所述标准数据表的初始特征包括:
获取自定义特征基元,并将所述自定义特征基元与包含有转换函数和/或聚合函数的预设特征基元作为所述第一特征基元;
将若干所述标准数据表整合为包含有所述标准数据表以及表间相互关系的实体集,利用所述第一特征基元在所述实体集上进行初始特征构造,得到所述初始特征。
可选地,所述基于所述目标特征集合与预设已有特征集合构建并训练特征模型矩阵,以从所述特征模型矩阵中确定出适配于当前场景的目标模型组合包括:
将所述目标特征集合与所述已有特征集合和划分为训练集与测试集,基于所述训练集与测试集构建并训练多个特征模型,将多个所述特征模型列为所述特征模型矩阵;
获取当前场景的场景评估指标,按照所述场景评估指标对所述特征模型矩阵中的各个所述特征模型进行评估,以确定出所述目标模型组合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安银行股份有限公司,未经平安银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011490106.6/2.html,转载请声明来源钻瓜专利网。