[发明专利]数据处理方法、装置、设备及存储介质在审
申请号: | 201911177388.1 | 申请日: | 2019-11-25 |
公开(公告)号: | CN110909085A | 公开(公告)日: | 2020-03-24 |
发明(设计)人: | 陈瑞钦;黄启军;李诗琦;唐兴兴;林冰垠 | 申请(专利权)人: | 深圳前海微众银行股份有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F17/18 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 王韬 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 设备 存储 介质 | ||
1.一种数据处理方法,其特征在于,所述数据处理方法包括:
获取各特征分箱的分箱分位点,按照所述分箱分位点对各特征分箱的特征数据块进行分组,以生成各特征分箱与各特征分箱的特征数据块之间的对应关系;
若检测到分箱调整指令,则根据所述分箱调整指令和所述对应关系,从各特征分箱中确定待调整分箱,以及所述待调整分箱的待调整特征数据块;
对所述待调整分箱和所述待调整特征数据块进行调整处理,并输出调整处理结果。
2.如权利要求1所述的数据处理方法,其特征在于,所述按照所述分箱分位点对各特征分箱的特征数据块进行分组,以生成各特征分箱与各特征分箱的特征数据块之间的对应关系,包括:
对各特征分箱的特征数据块进行缓存处理,并按照分箱分位点对各特征分箱的特征数据块进行分组,以生成各特征分箱与各特征分箱的特征数据块之间的对应关系;
所述对所述待调整分箱和所述待调整特征数据块进行调整处理,并输出调整处理结果,包括:
在缓存中对所述待调整分箱和所述待调整特征数据块进行调整处理,并输出调整处理结果。
3.如权利要求2所述的数据处理方法,其特征在于,所述在缓存中对所述待调整分箱和所述待调整特征数据块进行调整处理,包括:
在缓存中获取所述待调整特征数据块的待调整分位点,并获取所述分箱调整指令的指令类型;
根据所述指令类型、所述待调整分位点和所述分箱分位点,对所述待调整分箱和所述待调整特征数据块进行缓存调整处理。
4.如权利要求3所述的数据处理方法,其特征在于,所述根据所述指令类型、所述待调整分位点和所述分箱分位点,对所述待调整分箱和所述待调整特征数据块进行缓存调整处理,包括:
若所述指令类型为分箱拆分类型,则根据所述待调整分位点和所述分箱分位点,对所述待调整分箱和所述待调整特征数据块进行拆分处理,以获得多个目标拆分分箱,以及各目标拆分分箱对应的目标拆分数据块;
获取各目标拆分数据的第一统计信息,并根据各目标拆分分箱、各目标拆分分箱对应的目标拆分数据和各目标拆分数据对应的第一统计信息,生成缓存调整结果。
5.如权利要求3所述的数据处理方法,其特征在于,所述根据所述指令类型、所述待调整分位点和所述分箱分位点,对所述待调整分箱和所述待调整特征数据块进行缓存调整处理,包括:
若所述指令类型为分箱合并类型,则根据所述待调整分位点和所述分箱分位点,对所述待调整分箱和所述待调整特征数据块进行合并处理,以获得目标合并分箱,以及所述目标合并分箱对应的目标合并数据块;
获取待调整分箱的第二统计信息,并对所述第二统计信息进行相加汇总,以生成目标统计信息;
根据所述目标合并数据块和所述目标统计信息,生成缓存调整结果。
6.如权利要求1所述的数据处理方法,其特征在于,所述对所述待调整分箱和所述待调整特征数据块进行调整处理,并输出调整处理结果之后,还包括:
统计调整处理结果中各特征分箱的信息价值;
若信息价值大于或等于预设值,则确认调整处理效果合格;
若信息价值小于预设值,则确认调整处理效果不合格。
7.如权利要求6所述的数据处理方法,其特征在于,所述统计调整处理结果中各特征分箱的信息价值,包括:
统计调整处理结果中各特征分箱的event值和non-event值,以获得woe值;
根据所述event值、所述non-event值和所述woe值,以获得信息价值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳前海微众银行股份有限公司,未经深圳前海微众银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911177388.1/1.html,转载请声明来源钻瓜专利网。