[发明专利]用户信息的处理方法及装置、电子设备、存储介质在审
申请号: | 202110920381.5 | 申请日: | 2021-08-11 |
公开(公告)号: | CN113822464A | 公开(公告)日: | 2021-12-21 |
发明(设计)人: | 刘欢 | 申请(专利权)人: | 大箴(杭州)科技有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q30/02;G06N20/00;G06K9/62 |
代理公司: | 北京中强智尚知识产权代理有限公司 11448 | 代理人: | 贾依娇 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户信息 处理 方法 装置 电子设备 存储 介质 | ||
本发明提供了一种用户信息的处理方法及装置、电子设备、存储介质,该方法包括:获取目标用户的用户信息,其中,所述用户信息至少包括用户个人信息和历史金融行为信息;将所述用户信息输入预先训练的用户收入水平预测模型进行特征学习,输出所述目标用户的收入水平信息;其中,所述用户收入水平预测模型为利用含有用户个人信息、历史金融行为信息、信用卡授信额度和历史收入信息的用户样本集训练回归树模型得到。通过本发明,解决了现有的规则模型对用户收入水平预测不准确的技术问题。
技术领域
本发明涉及数据处理技术领域,具体而言,涉及一种用户信息的处理方法及装置、电子设备、存储介质。
背景技术
目前,用户的收入水平为构建用户画像提供了有效的支持,并且收入水平也是影响消费能力的主要因素之一,在商业领域有着不可或缺的需求。然而,由于目前社会收入的多元化,难以精准的体现出用户的收入水平。
现有的评估用户收入水平的常规规则模型,比如关键字匹配,其覆盖用户量少,而且规则具有一定局限性,用户收入评估不准确。
针对上述相关技术中存在的技术问题,目前没有提出有效的解决方案。
发明内容
鉴于上述问题,本发明提出了一种用户信息的处理方法及装置、电子设备、存储介质,以至少解决现有的规则模型对用户收入水平预测不准确的技术问题。
第一方面,本发明提供了一种用户信息的处理方法,包括:获取目标用户的用户信息,其中,所述用户信息至少包括用户个人信息和历史金融行为信息;将所述用户信息输入预先训练的用户收入水平预测模型进行特征学习,输出所述目标用户的收入水平信息;其中,所述用户收入水平预测模型为利用含有用户个人信息、历史金融行为信息、信用卡授信额度和历史收入信息的用户样本集训练回归树模型得到。
可选的,在将所述用户信息输入预先训练的用户收入水平预测模型进行特征学习之前,所述方法还包括:获取包含多个用户对应的用户信息的用户样本集,其中,所述用户样本集包括各个用户的用户个人信息、各个用户的历史金融行为信息、各个用户的信用卡授信额度和各个用户的历史收入信息;对所述用户样本集进行数据清洗,得到标准化样本集;利用所述标准化样本集训练所述回归树模型,得到所述用户收入水平预测模型。
可选的,所述获取包含多个用户对应的用户信息的用户样本集包括:获取包含多个第一用户对应的用户信息的基础用户样本集;基于所述基础用户样本集中各所述第一用户对应的历史收入信息和信用卡授信额度,从所述多个第一用户中筛选出符合预设条件的多个第二用户;其中,所述预设条件为各个用户的历史收入信息位于[信用卡授信额度/n,信用卡授信额度],n为固定常量;从所述基础用户样本集中筛选出包含所述多个第二用户对应的用户信息的筛选用户样本集,作为所述用户样本集。
可选的,所述用户样本集中每个信息对应一个特征值,所述对所述用户样本集进行数据清洗包括以下至少之一:修正所述用户样本集中存在明显错误的特征值;完善所述用户样本集中存在部分信息遗漏的特征值;对所述用户样本集中的特征值进行特征标准化。
可选的,所述通过将所述标准化样本集输入所述回归树进行训练,生成所述用户收入水平预测模型包括:步骤A,按照预设比例将所述标准化样本集划分为训练集和测试集;步骤B,将所述训练集输入所述回归树模型进行训练,生成预训练模型;步骤C,通过将所述测试集中的用户个人信息和历史金融行为信息输入所述预训练模型进行特征学习,输出所述测试集对应的收入水平信息;步骤D,根据所述测试集对应的收入水平信息和所述测试集中的历史收入信息计算所述预训练模型的误差;循环执行上述步骤A、步骤B、步骤C及步骤D,直到所述误差取得最小值时,结束对所述预训练模型的迭代训练,并将所述误差取最小值时对应的预训练模型作为所述用户收入水平预测模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大箴(杭州)科技有限公司,未经大箴(杭州)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110920381.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可以限制蒸汽流量的发酵装置
- 下一篇:一种藻叶体防侧漏卫生巾
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理