[发明专利]用于机器学习模型的样本数据生成方法、装置及电子设备在审
申请号: | 201910921527.0 | 申请日: | 2019-09-27 |
公开(公告)号: | CN110781922A | 公开(公告)日: | 2020-02-11 |
发明(设计)人: | 高明宇;王鹏;张潮华;郑彦 | 申请(专利权)人: | 北京淇瑀信息科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/10;G06Q10/06 |
代理公司: | 11691 北京清诚知识产权代理有限公司 | 代理人: | 曹玲柱 |
地址: | 100012 北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本公开涉及一种用于机器学习模型的样本数据生成方法、装置、电子设备及计算机可读介质。该方法包括:根据用户活跃时间和异常值监测算法将多个历史用户分入正样本集合、负样本集合和未分类样本集合;基于正样本集合、负样本集合对第一机器学习模型进行训练,生成用户分类模型;将未分类样本集合中的历史用户的金融数据输入用户分类模型中,生成正样本子集合和负样本子集合;通过正样本集合、正样本子集合生成用于机器学习模型的正样本数据;以及通过负样本集合、负样本子集合生成用于机器学习模型的负样本数据。本公开的一种用于机器学习模型的样本数据生成方法,能够对现有的正负样本数据进行数据处理生成更加精确的正负样本数据集合。 | ||
搜索关键词: | 集合 负样本 正样本 机器学习模型 子集合 分类样本 历史用户 样本数据 正负样本 计算机可读介质 异常值监测 电子设备 分类模型 金融数据 输入用户 数据处理 数据集合 用户分类 算法 | ||
【主权项】:
1.一种用于机器学习模型的样本数据生成方法,其特征在于,包括:/n获取多个历史用户的金融数据,所述金融数据中包括用户活跃时间;/n根据所述用户活跃时间和异常值监测算法将所述多个历史用户分入正样本集合、负样本集合和未分类样本集合;/n基于所述正样本集合、所述负样本集合对第一机器学习模型进行训练,生成用户分类模型;/n将所述未分类样本集合中的历史用户的金融数据输入所述用户分类模型中,生成正样本子集合和负样本子集合;/n通过正样本集合、正样本子集合生成用于机器学习模型的正样本数据;以及/n通过负样本集合、负样本子集合生成用于机器学习模型的负样本数据。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京淇瑀信息科技有限公司,未经北京淇瑀信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910921527.0/,转载请声明来源钻瓜专利网。