[发明专利]机器学习模型训练方法、装置和计算机设备有效
申请号: | 201710322670.9 | 申请日: | 2017-05-09 |
公开(公告)号: | CN108304935B | 公开(公告)日: | 2022-01-18 |
发明(设计)人: | 刘成烽;郑博;黄巩怡;段培 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06K9/62 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 何平;邓云鹏 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 机器 学习 模型 训练 方法 装置 计算机 设备 | ||
本申请涉及一种机器学习模型训练方法、装置和计算机设备,该方法包括:获取通过社交平台的用户标识相关联的第一用户数据及第一标签;所述第一标签源自第一业务,所述第一用户数据源自所述社交平台;获取通过所述社交平台的用户标识相关联的第二用户数据及第二标签;所述第二用户数据源自所述社交平台,所述第二标签源自第二业务;根据所述第一用户数据、所述第一标签、所述第二用户数据和所述第二标签,训练针对所述第二业务的机器学习模型。本申请的方案可以尽量避免在训练样本不足时导致机器学习模型预测准确性较低的问题。
技术领域
本发明涉及计算机技术领域,特别是涉及一种机器学习模型训练方法、装置和计算机设备。
背景技术
机器学习,是让机器基于训练样本训练出机器学习模型的过程,使得机器学习模型具有对训练样本之外的数据具有预测能力。比如,开放人员可以累积与用户信用有关的用户数据,并人工对该用户数据添加标签,从而利用带有标签的用户数据训练机器学习模型;当已知目标用户的用户数据时,就可以利用该机器学习模型预测目标用户的用户信用。
然而,目前训练机器学习模型时,需要大量带标签的训练样本,而在业务启动初期,难以累积到足够数量的训练样本,从而导致训练的机器学习模型预测准确性较低。
发明内容
基于此,有必要针对目前机器学习模型预测准确性较低的问题,提供一种机器学习模型训练方法、装置和计算机设备。
一种机器学习模型训练方法,包括:
获取通过社交平台的用户标识相关联的第一用户数据及第一标签;所述第一标签源自第一业务,所述第一用户数据源自所述社交平台;
获取通过所述社交平台的用户标识相关联的第二用户数据及第二标签;所述第二用户数据源自所述社交平台,所述第二标签源自第二业务;
根据所述第一用户数据、所述第一标签、所述第二用户数据和所述第二标签,训练针对所述第二业务的机器学习模型。
一种机器学习模型训练装置,包括:
数据收集模块,用于获取通过社交平台的用户标识相关联的第一用户数据及第一标签;所述第一标签源自第一业务,所述第一用户数据源自所述社交平台;获取通过所述社交平台的用户标识相关联的第二用户数据及第二标签;所述第二用户数据源自所述社交平台,所述第二标签源自第二业务;
训练模块,用于根据所述第一用户数据、所述第一标签、所述第二用户数据和所述第二标签,训练针对所述第二业务的机器学习模型。
一种计算机设备,包括存储器和处理器,所述存储器中储存有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行机器学习模型训练方法的步骤。
上述机器学习模型训练方法、装置和计算机设备,通过社交平台的用户标识,可以将第一业务的第一标签和社交平台中的第一用户数据相关联,并将第二业务的第二标签和社交平台中的第二用户数据相关联。增加第一业务的第一标签,可以补充第二业务所缺乏的第二标签,结合社交平台中存在的第一用户数据和第二用户数据,可以训练出针对第二业务的机器学习模型,该机器学习模型可以实现针对第二业务的预测,可尽量避免在训练样本不足时导致机器学习模型预测准确性较低的问题。
附图说明
图1为一个实施例中机器学习模型训练方法的应用环境图;
图2为一个实施例中用于实施机器学习模型训练方法的计算机设备的内部结构示意图;
图3为一个实施例中机器学习模型训练方法的流程示意图;
图4为一个实施例中根据所述第一用户数据、所述第一标签、所述第二用户数据和所述第二标签,训练针对所述第二业务的机器学习模型的步骤的流程示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710322670.9/2.html,转载请声明来源钻瓜专利网。