[发明专利]基于样本扩展的用户分析方法、装置、设备及存储介质在审
申请号: | 202211218175.0 | 申请日: | 2022-09-30 |
公开(公告)号: | CN115423532A | 公开(公告)日: | 2022-12-02 |
发明(设计)人: | 陈鹏;吕书径;李霞 | 申请(专利权)人: | 中国建设银行股份有限公司;建信金融科技有限责任公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06Q10/06 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 蔡舒野 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 样本 扩展 用户 分析 方法 装置 设备 存储 介质 | ||
本申请提供一种基于样本扩展的用户分析方法、装置、设备及存储介质。涉及大数据分析技术领域。该方法包括:根据对象样本数据确定初始样本,初始样本包括多个权重等级;确定每个权重等级的原始等级数据;根据原始等级数据进行样本扩展,得到模拟等级数据;根据模拟等级数据所在权重等级和对象样本数据确定模拟等级数据的模拟最终得分;根据初始样本和模拟等级数据,确定等级总体样本库;根据初始样本确定的初始样本最终得分和模拟等级数据的模拟最终得分,确定得分总体样本库;当触发目标用户评分请求时,根据目标用户数据和总样本库确定目标用户评分信息,能够实现自动化的用户评价,提高用户评分的准确性。
技术领域
本申请实施例涉及大数据分析技术领域,尤其涉及一种基于样本扩展的用户分析方法、装置、设备及存储介质。
背景技术
目前在进行用户评级时,通常采用人工审核方式,人工抽取客户的关键性经济指标作为依据,根据各经济指标的数值进行风险等级的评估。
然而人工审核方式不仅速度慢而且准确性无法统一控制。通过模型进行用户评级时,由于有效的样本数据少,导致无法训练出可靠的评测模型,进而无法准确的评估用户评级。
发明内容
本申请提供一种基于样本扩展的用户分析方法、装置、设备及存储介质,用以解决现有技术中样本数据量少,无法训练可靠的评测模型,进而无法准确的评估用户评级的问题。
第一方面,本申请实施例提供了一种基于样本扩展的用户分析方法,包括:
根据对象样本数据确定初始样本,初始样本包括多个权重等级,权重等级用于表示对象样本数据中样本对象的重要性权重等级;
确定每个权重等级的原始等级数据,原始等级数据表示样本对象位于权重等级的概率;
根据原始等级数据进行样本扩展,得到模拟等级数据;
根据模拟等级数据所在权重等级和对象样本数据确定模拟等级数据的模拟最终得分;
根据初始样本和模拟等级数据,确定等级总体样本库;根据初始样本确定的初始样本最终得分和模拟等级数据的模拟最终得分,确定得分总体样本库;
当触发目标用户评分请求时,根据目标用户数据和总样本库确定目标用户评分信息,总样本库包括等级总体样本库和得分总体样本库。
第二方面,本申请实施例还提供了一种基于样本扩展的用户分装置,其特征在于,包括:
初始样本确定模块,用于根据对象样本数据确定初始样本,初始样本包括多个权重等级,权重等级用于表示对象样本数据中样本对象的重要性权重等级;
原始等级数据确定模块,用于确定每个权重等级的原始等级数据,原始等级数据表示样本对象位于权重等级的概率;
模拟等级数据生成模块,用于根据原始等级数据进行样本扩展,得到模拟等级数据;
模拟得分确定模块,用于根据模拟等级数据所在权重等级和对象样本数据确定模拟等级数据的模拟最终得分;
总样本库确定模块,用于根据初始样本和模拟等级数据,确定等级总体样本库;根据初始样本确定的初始样本最终得分和模拟等级数据的模拟最终得分,确定得分总体样本库;
评分模块,用于当触发目标用户评分请求时,根据目标用户数据和总样本库确定目标用户评分信息,总样本库包括等级总体样本库和得分总体样本库。
第三方面,本申请实施例还提供了一种服务器,包括:处理器,以及与处理器通信连接的存储器;
存储器存储计算机执行指令;
处理器执行存储器存储的计算机执行指令,以实现如本申请实施例所示的基于样本扩展的用户分析方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国建设银行股份有限公司;建信金融科技有限责任公司,未经中国建设银行股份有限公司;建信金融科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211218175.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种QT线程优化方法、装置、计算机设备及存储介质
- 下一篇:一种喂食机