[发明专利]生成多任务模型的方法、装置、设备、介质及程序产品在审
申请号: | 202011550776.2 | 申请日: | 2020-12-24 |
公开(公告)号: | CN112541124A | 公开(公告)日: | 2021-03-23 |
发明(设计)人: | 余晓峰;刘强;郑立涛 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06K9/62;G06N20/20 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 生成 任务 模型 方法 装置 设备 介质 程序 产品 | ||
1.一种生成多任务模型的方法,包括:
获取信息样本集,其中,所述信息样本集的样本包括:针对信息的信息特征和对应的特征参数标签与针对所述信息的用户行为特征和对应的行为类别标签;
将所述信息特征作为所述多任务模型所包括的主任务网络的输入,将所述特征参数标签作为所述主任务网络的输出;以及,将所述用户行为特征作为所述多任务模型所包括的辅助任务网络的输入,将所述行为类别标签作为所述辅助任务网络的输出,训练机器学习模型,得到多任务模型。
2.根据权利要求1所述的方法,其中,所述主任务网络包括共享隐层、以及与共享隐藏依次连接的第一特定表征层和第一输出层;所述辅助任务网络包括所述共享隐层,以及与所述共享隐层依次连接的第二特定表征层和第二输出层。
3.根据权利要求2所述的方法,其中,所述获取信息样本集,包括:
获取信息;
将所述信息输入所述共享隐层中,得到信息的共享特征;
将所述共享特征输入所述第一特定表征层中,利用注意力机制,得到所述信息特征;以及,将所述共享特征输入所述第二特定表征层中,利用注意力机制,得到所述用户行为特征;
获取与所述信息特征对应的特征参数标签,以及与所述用户行为特征对应的行为类别标签。
4.根据权利要求3所述的方法,其中,所述主任务网络还包括:第一全连接层和第一多层感知器层,所述第一特定表征层依次与所述第一全连接层、所述第一多层感知器层和所述第一输出层连接;以及,所述辅助任务网络还包括:第二全连接层和第二多层感知器层,所述第二特定表征层依次与所述第二全连接层、所述第二多层感知器层和所述第二输出层连接。
5.根据权利要求4所述的方法,其中,所述共享特征包括以下至少一项:
用户特征、流量数据特征、落地页模板特征、落地页的内容特征。
6.根据权利要求1-5任一项所述的方法,其中,所述将所述信息特征作为所述多任务模型所包括的主任务网络的输入,将所述特征参数标签作为所述主任务网络的输出;以及,将所述用户行为特征作为所述多任务模型所包括的辅助任务网络的输入,将所述行为类别标签作为所述辅助任务网络的输出,训练机器学习模型,得到多任务模型,包括:
将所述信息特征输入所述主任务网络中,得到特征参数预估值;以及,将所述用户行为特征输入所述辅助任务网络中,得到行为类别预估值;
基于所述特征参数预估值和所述特征参数标签,确定第一损失函数;以及基于所述行为类别预估值和所述行为类别标签,确定第二损失函数;
根据所述第一损失函数和所述第二损失函数,得到联合损失函数;
响应于所述联合损失函数满足预设的迭代截止条件,将所述机器学习模型作为多任务模型。
7.根据权利要求6所述的方法,其中,所述根据所述第一损失函数和所述第二损失函数,得到联合损失函数,包括:
根据所述第一损失函数和预设的第一权重,以及所述第二损失函数和预设的第二权重,得到联合损失函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011550776.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:高亲和PVR突变体
- 下一篇:建立图像增强模型与图像增强的方法、装置