[发明专利]一种业务数据报表的分类方法及装置在审
申请号: | 202111443212.3 | 申请日: | 2021-11-30 |
公开(公告)号: | CN114117052A | 公开(公告)日: | 2022-03-01 |
发明(设计)人: | 王聪;曾岩;李晶 | 申请(专利权)人: | 深圳前海微众银行股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/31 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 王春波 |
地址: | 518027 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 业务 数据 报表 分类 方法 装置 | ||
本发明实施例提供了一种业务数据报表的分类方法及装置,该方法包括针对任一设定业务的第一业务数据报表,通过对第一业务数据报表中的各业务字段进行关联分析,确定出至少两个与目标预测字段具有强关联特性的关键字段,并针对每个关键字段,确定该关键字段的信息增益,将各关键字段的信息增益进行比对,确定出信息增益最大的关键字段作为第一关键字段,并以第一关键字段作为构建分类树的根节点,基于各关键字段中除第一关键字段以外的各第二关键字段的信息增益确定各第二关键字段作为分类树的子节点的位置,从而构建出第一分类树。如此,该方案可以减少依靠人工实现数据降维所耗费的时间和人力,从而可以有效地提高业务数据报表的分类效率。
技术领域
本发明实施例涉及金融科技(Fintech)领域,尤其涉及一种业务数据报表的分类方法及装置。
背景技术
随着计算机技术的发展,越来越多的技术应用在金融领域,传统金融业正在逐步向金融科技转变,但由于金融行业的安全性、实时性要求,也对技术提出的更高的要求。在金融领域,随着金融业务的不断发展,金融业务数据不但增多而且变得复杂,也即是说,金融业务数据的业务字段(即数据维度的字段)也会增多,如此,高维度的金融业务数据使得在生成业务数据报表或进行金融业务分析时会遇到较多困难,比如,在生成业务数据报表时因数据维度的字段过多使得报表的布局杂乱、不够清晰直观,或者在针对某一金融业务指标进行分类预测时就会遇到维度灾难,从而给数据需求人员带来不好的体验。因此,为了确保金融服务质量,在生成业务数据报表或分析高维度的金融业务数据时,需要针对高维度的金融业务数据进行数据降维处理。
现阶段,对于高维度的金融业务数据,通常采用人工进行特征选择的方式来实现数据降维。具体地,采用人工过滤的方式从高维度的金融业务数据的多个业务字段中选择出至少两个关键字段,并根据该至少两个关键字段所对应的金融业务数据进行生成用于展示的业务数据报表,或者根据该至少两个关键字段所对应的金融业务数据进行金融业务的数据分析。然而,这种处理方式由于依赖人工进行数据降维处理,因此主观性较大,使得人工所选择出的关键字段准确性不高,且,人工进行关键字段的选择需要耗费较长的时间和精力,从而导致数据处理的效率低。
综上,目前亟需一种业务数据报表的分类方法,用以有效地提高业务数据报表的分类效率。
发明内容
本发明实施例提供了一种业务数据报表的分类方法及装置,用以有效地提高业务数据报表的分类效率。
第一方面,本发明实施例提供了一种业务数据报表的分类方法,包括:
针对任一设定业务的第一业务数据报表,通过对所述第一业务数据报表中的各业务字段进行关联分析,确定出至少两个与目标预测字段具有强关联特性的关键字段;
通过所述目标预测字段所具有的各分类类别在所述第一业务数据报表中的统计数量确定第一信息量,并针对每个关键字段,通过所述关键字段在所述第一业务数据报表中具有所述目标预测字段的每个分类类别的统计数量确定所述关键字段的信息熵,根据所述第一信息量和所述关键字段的信息熵,确定所述关键字段的信息增益;
将各关键字段的信息增益进行比对,确定出信息增益最大的关键字段作为第一关键字段,并以所述第一关键字段作为构建分类树的根节点,基于所述各关键字段中除所述第一关键字段以外的各第二关键字段的信息增益确定所述各第二关键字段作为分类树的子节点的位置,从而构建出第一分类树;所述第一分类树用于对所述目标预测字段的分类类别进行预测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳前海微众银行股份有限公司,未经深圳前海微众银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111443212.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种焚烧炉用掺烧型油气燃烧器
- 下一篇:一种分布式能源条件下配电网的保护方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置