[发明专利]模型训练方法及装置有效
申请号: | 201510456763.1 | 申请日: | 2015-07-29 |
公开(公告)号: | CN105046366B | 公开(公告)日: | 2018-06-08 |
发明(设计)人: | 金涬;李毅;邹永强;郭志懋;薛伟;肖磊 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06F17/30 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 张所明 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 预估 训练样本集 候选模型 代价函数 模型训练 训练样本 凸函数 计算机技术领域 内容特征 实际行为 用户特征 质量波动 正整数 | ||
本发明公开了一种模型训练方法及装置,属于计算机技术领域。所述方法包括:构造代价函数为非凸函数的模型;获取训练样本集,所述训练样本集包括用于训练所述模型的各个训练样本,每个训练样本包括用户特征、内容特征和用户对内容所采取的实际行为所对应的操作值;根据所述训练样本集对所述模型进行训练,得到n个候选模型,n为大于1的正整数;将所述n个候选模型中质量最好的候选模型确定为本次训练得到的预估模型。本发明解决了代价函数为非凸函数的预估模型的模型质量波动大的问题,达到了提高最终训练得到的预估模型的模型质量的效果。
技术领域
本发明涉及计算机技术领域,特别涉及一种模型训练方法及装置。
背景技术
内容点击率预估用于预估用户点击一个内容的概率。内容点击率的影响因素包括用户特征和内容特征,即,用户的喜好、不同内容的投放位置、展现形式、内容素材等会影响内容点击率的预估值,因此,可以根据内容被用户点击和未被用户点击的历史数据来训练预估模型,通过预估模型来预估内容点击率。
现有的一种模型训练方法包括:构造深度神经网络;获取历史数据,并将历史数据中的每个用户特征、与每个用户特征对应的内容特征、用户对内容采取的实际行为确定为一个训练样本;从各个训练样本中学习非线性信息;通过对非线性信息设置固定的迭代轮数来训练深度神经网络,得到预估模型。
由于深度神经网络的代价函数是非凸函数,因此,该预估模型在训练过程中的模型质量的波动较大,最终训练得到的预估模型的模型质量不稳定。
发明内容
为了解决代价函数是非凸函数的预估模型的模型质量波动大,最终训练得到的预估模型的模型质量不稳定的问题,本发明实施例提供了一种模型训练方法及装置。所述技术方案如下:
第一方面,提供了一种模型训练方法,所述方法包括:
构造代价函数为非凸函数的模型;
获取训练样本集,所述训练样本集包括用于训练所述模型的各个训练样本,每个训练样本包括用户特征、内容特征和用户对内容所采取的实际行为所对应的操作值;
根据所述训练样本集对所述模型进行训练,得到n个候选模型,n为大于1的正整数;
将所述n个候选模型中质量最好的候选模型确定为本次训练得到的预估模型。
第二方面,提供了一种模型训练装置,所述装置包括:
模型构造模块,用于构造代价函数为非凸函数的模型;
样本集获取模块,用于获取训练样本集,所述训练样本集包括用于训练所述模型构造模块构造的所述模型的各个训练样本,每个训练样本包括用户特征、内容特征和用户对内容所采取的实际行为所对应的操作值;
候选模型获取模块,用于根据所述样本集获取模块得到的所述训练样本集对所述模型进行训练,得到n个候选模型,n为大于1的正整数;
预估模型确定模块,用于将所述候选模型获取模块得到的所述n个候选模型中质量最好的候选模型确定为本次训练得到的预估模型。
本发明实施例提供的技术方案的有益效果是:
通过构造代价函数为非凸函数的模型;获取训练样本集,该训练样本集包括用于训练模型的各个训练样本,每个训练样本包括用户特征、内容特征和用户对内容所采取的实际行为所对应的操作值;根据训练样本集对模型进行训练,得到n个候选模型;将n个候选模型中质量最好的候选模型确定为本次训练得到的预估模型,解决了代价函数是非凸函数的预估模型的模型质量波动大,最终训练得到的预估模型的模型质量不稳定的问题,达到了提高最终训练得到的预估模型的模型质量的效果。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510456763.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种螺旋脱水麦糟输送装置
- 下一篇:菜籽油加工用蒸炒装置