[发明专利]一种样本扩充方法、装置、设备及可读存储介质在审
申请号: | 202210216222.1 | 申请日: | 2022-03-07 |
公开(公告)号: | CN114742126A | 公开(公告)日: | 2022-07-12 |
发明(设计)人: | 吴慧;卓正兴;杨青 | 申请(专利权)人: | 度小满科技(北京)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q40/02 |
代理公司: | 北京知帆远景知识产权代理有限公司 11890 | 代理人: | 刘岩磊 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 样本 扩充 方法 装置 设备 可读 存储 介质 | ||
本发明公开了一种样本扩充方法,该方法直接从历史产品的记录数据中挑选属性相似且满足表现期时长的历史产品记录,将其作为新产品的扩充样本添加至样本集中进行建模分析,属性相似性的评判可以有效保障模型分析效果;且样本扩充的过程无需等待新产品的运行表现,具有高时效性;另外,该方法可以直接依据属性以及表现期长度自动进行指标判断,稳定性强且简单高效。本发明还公开了一种样本扩充装置、设备及可读存储介质,具有相应的技术效果。
技术领域
本发明涉及智能金融技术领域,特别是涉及一种样本扩充方法、装置、设备及可读存储介质。
背景技术
随着科技的发展,传统金融业正在逐步向智能化领域迈进,越来越多的信贷机构采用建立模型的方式实现相应的业务需求。比如在办理借贷业务之前利用已有风险表现的样本构建机器学习模型来对借款人的资质和风险进行评估,以确定借款人未来逾期风险,从而确保借贷资金安全、实现盈利。
然而信贷机构在开展新业务产品时会面临冷启动的问题,即需要等待一段时间才能积累足够多且满足表现期的建模样本,导致不能在新产品早期及时构建模型,无法及时对用户进行准确的评估。针对这种情况,目前主要采用基于实例的迁移学习方法来解决新产品冷启动时的建模问题。
但是,迁移学习方法需要积累一定量的新产品有标签样本后才能实施,客户从申请新信贷产品到有表现再到设置标签,通常需要等待一段时间,因此该方法无法实现及时分析处理;另外,迁移学习方法中需要设置样本的初始权重和选择比较合适的基分类器,而初始权重的设置比较依赖先验知识,初始权重设置不当或者基分类器选择不合适都会影响计算稳定性和最终模型效果,因此计算稳定性和精准度较差。
综上所述,如何快速精准地实现新产品建模样本集的扩充,是目前本领域技术人员急需解决的技术问题。
发明内容
本发明的目的是提供一种样本扩充方法、装置、设备及可读存储介质,以快速精准扩充新产品建模样本集。
为解决上述技术问题,本发明提供如下技术方案:
一种样本扩充方法,包括:
接收到样本扩充请求后,确定待扩充的新产品的产品信息;其中,所述产品信息包括:属性信息以及表现期长度;
获取存储的各历史产品的属性信息;
根据所述新产品与各所述历史产品的属性信息,依据规则筛选出与所述新产品属性相似的历史产品,作为相似产品;
提取出所述相似产品对应存储的表现期长度不小于所述新产品的产品记录,作为候选样本;
将所述候选样本添加至所述新产品的样本集。
可选地,在所述将所述候选样本添加至所述新产品的样本集之前,还包括:
确定所述候选样本的数量;
判断所述数量是否属于目标范围;
若属于,执行所述将所述候选样本添加至所述新产品的样本集的步骤;
若不属于,根据所述数量与待配置样本数量间的差异调整所述规则,并执行所述根据所述新产品与各所述历史产品的属性信息,依据规则筛选出与所述新产品属性相似的历史产品的步骤。
可选地,在所述将所述候选样本添加至所述新产品的样本集之前,还包括:
确定所述候选样本的样本类型;其中,所述样本类型包括:好样本和坏样本;
提取出所述样本类型符合预设提取类型的候选样本,作为类型匹配样本;
则相应地,所述将所述候选样本添加至所述新产品的样本集,具体为:将所述类型匹配样本添加至所述新产品的样本集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于度小满科技(北京)有限公司,未经度小满科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210216222.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:水田作业车
- 下一篇:依赖文件缓存更新的方法、装置、计算机设备及存储介质