[发明专利]建模方法、装置及电子设备在审
申请号: | 202011247798.1 | 申请日: | 2020-11-10 |
公开(公告)号: | CN112308170A | 公开(公告)日: | 2021-02-02 |
发明(设计)人: | 杨鹏 | 申请(专利权)人: | 维沃移动通信有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 乔珊珊 |
地址: | 523863 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 建模 方法 装置 电子设备 | ||
本申请公开了建模方法、装置及电子设备,属于通信技术领域,其中,所述方法包括:按照生成时间先后顺序,将样本数据划分至N个集合;从生成时间最短的样本数据所在的目标集合中,确定第一开发样本;根据所述第一开发样本,训练得到第一模型;将第一集合中满足第一预设条件的异常样本与所述第一开发样本合并,得到第二开发样本;根据所述第二开发样本,训练得到第二模型;比较所述第一模型和所述第二模型,将其中之一确定为目标模型;根据所述目标模型,得到最终模型。本申请公开的建模方法,能够提升所建目标模型的稳定性。
技术领域
本申请实施例涉及数据处理技术领域,尤其涉及一种建模方法、装置及电子设备。
背景技术
在反欺诈和异常检测的场景中,经常会使用有监督学习算法建立预测模型。在通常构造训练样本的过程中会存在如下两个问题:问题一,训练样本构造过程中经常会选择不同时间段的数据,但部分业务场景用户特征会随时间季节发生变化,致使不同时期的训练样本数据分布存在很大差异;问题二,构造的训练样本中异常样本与正常样本不均衡。
以未成年用户游戏消费投诉为例,通过历史消费订单数据及未成年投诉数据建立有监督算法模型时,将历史未成年消费投诉用户订单标记为异常样本,非投诉订单数据标记为正常样本,未成年不同时间点或季节消费特征不同,不同时间段构造的训练样本数据分布不同。现有技术中仅使用近期的训练样本数据建模,由于异常样本量较小、异常样本与正常样本不均衡等问题,致使导致所建模型稳定性差。
发明内容
本申请实施例的目的是提供一种建模方法,能够解决现有的建模方案中存在的所建模型稳定性差的问题。
为了解决上述技术问题,本申请是这样实现的:
第一方面,本申请实施例提供了一种建模方法,其中,所述方法包括:按照生成时间先后顺序,将样本数据划分至N个集合;从生成时间最短的样本数据所在的目标集合中,确定第一开发样本;根据所述第一开发样本,训练得到第一模型;将第一集合中满足第一预设条件的异常样本与所述第一开发样本合并,得到第二开发样本;其中,所述第一集合为所述N个集合中,除所述目标集合以外的其他一个集合;根据所述第二开发样本,训练得到第二模型;比较所述第一模型和所述第二模型,将其中之一确定为目标模型;根据所述目标模型,得到最终模型。
第二方面,本申请实施例提供了一种建模装置,其中,所述装置包括:分割模块,用于按照生成时间先后顺序,将样本数据划分至N个集合;确定模块,用于从生成时间最短的样本数据所在的目标集合中,确定第一开发样本;第一训练模块,用于根据所述第一开发样本,训练得到第一模型;合并模块,用于将第一集合中满足第一预设条件的异常样本与所述第一开发样本合并,得到第二开发样本;其中,所述第一集合为所述N个集合中,除所述目标集合以外的其他一个集合;第二训练模块,用于根据所述第二开发样本,训练得到第二模型;比较模块,用于比较所述第一模型和所述第二模型,将其中之一确定为目标模型;模型确定模块,用于根据所述目标模型,得到最终模型。
第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。
第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。
第五方面,本申请实施例提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于维沃移动通信有限公司,未经维沃移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011247798.1/2.html,转载请声明来源钻瓜专利网。