[发明专利]数据处理方法、装置和目标对象风险监控方法在审
申请号: | 201911173683.X | 申请日: | 2019-11-26 |
公开(公告)号: | CN111105144A | 公开(公告)日: | 2020-05-05 |
发明(设计)人: | 董肖凯;樊帅 | 申请(专利权)人: | 苏宁金融科技(南京)有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06N20/00 |
代理公司: | 北京市万慧达律师事务所 11111 | 代理人: | 刘艳丽 |
地址: | 211800 江苏省南京市江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 目标 对象 风险 监控 | ||
本申请涉及一种数据处理方法、装置、计算机设备和存储介质。该方法包括:获取目标对象的属性数据,属性数据为连续型数据;根据目标预设分箱标准对属性数据进行分箱处理,得到多个当前箱体,各个当前箱体包括对应的当前离散型数据;获取各个当前箱体对应的第一阈值和第二阈值;根据第一阈值和第二阈值对各个当前箱体中的当前离散型数据进行更新,得到目标对象对应的目标离散型数据,目标离散型数据作为建立目标对象风险监控模型的特征向量。此外,还提供了一种目标对象风险监控方法、装置、计算机设备和存储介质。
技术领域
本申请涉及计算机技术领域,特别是涉及一种数据处理方法、装置、计算机设备和存储介质,以及目标对象风险监控方法、装置、计算机设备和存储介质。
背景技术
随着计算机技术的发展,出现了机器学习技术,机器学习在人工智能领域起到至关重要的作用,而特征工程是机器学习中最重要的步骤,也是机器学习模型建立的必要前提,其中,风险监控模型是机器学习模型中的一种,然而在建立风险监控模型时,需要对连续型变量进行离散化处理,离散化处理后的特征能够降低模拟过拟合的风险,提高风险监控模型的稳定性。其中,目前典型的连续型变量的离散化处理是分箱处理,得到分箱后的箱体,但是由于分箱得到的箱体过多以及箱体内的离散型数据数目过多,导致连续型变量离散化处理不准确,进一步造成后续风险监控模型出现过拟合现象,因此造成风险监控模型输出的风险监控结果不准确。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高离散处理的准确性从而提高风险监控模型的准确率的数据处理方法、装置、计算机设备和存储介质,以及目标对象风险监控方法、装置、计算机设备和存储介质。
一种数据处理方法,该方法包括:
获取目标对象的属性数据,属性数据为连续型数据;
根据目标预设分箱标准对属性数据进行分箱处理,得到多个当前箱体,各个当前箱体包括对应的当前离散型数据;
获取各个当前箱体对应的第一阈值和第二阈值;
根据第一阈值和第二阈值对各个当前箱体中的当前离散型数据进行更新,得到目标对象对应的目标离散型数据,目标离散型数据作为建立目标对象风险监控模型的特征向量。
一种数据处理装置,该装置包括:
属性数据获取模块,用于获取目标对象的属性数据,属性数据为连续型数据;
属性数据处理模块,用于根据目标预设分箱标准对属性数据进行分箱处理,得到多个当前箱体,各个当前箱体包括对应的当前离散型数据;
权重因子获取模块,用于获取各个当前箱体对应的第一阈值和第二阈值;
离散型数据生成模块,用于根据第一阈值和第二阈值对各个当前箱体中的当前离散型数据进行更新,得到目标对象对应的目标离散型数据,目标离散型数据作为建立目标对象风险监控模型的特征向量。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取目标对象的属性数据,属性数据为连续型数据;
根据目标预设分箱标准对属性数据进行分箱处理,得到多个当前箱体,各个当前箱体包括对应的当前离散型数据;
获取各个当前箱体对应的第一阈值和第二阈值;
根据第一阈值和第二阈值对各个当前箱体中的当前离散型数据进行更新,得到目标对象对应的目标离散型数据,目标离散型数据作为建立目标对象风险监控模型的特征向量。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏宁金融科技(南京)有限公司,未经苏宁金融科技(南京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911173683.X/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理