[发明专利]用户分类模型的方法、装置、电子设备和存储介质有效
申请号: | 202011042247.1 | 申请日: | 2020-09-28 |
公开(公告)号: | CN112116024B | 公开(公告)日: | 2021-08-13 |
发明(设计)人: | 李振鹏;姜佳男;郭玉红 | 申请(专利权)人: | 北京嘀嘀无限科技发展有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京睿派知识产权代理事务所(普通合伙) 11597 | 代理人: | 刘锋 |
地址: | 100193 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 分类 模型 方法 装置 电子设备 存储 介质 | ||
1.一种用户分类模型的训练方法,其特征在于,所述方法包括:
获取目标域数据集、源域数据集、随机噪声和目标域数据集中的目标样本数据的缺失特征集合,所述源域数据集包括具有标签的多个源域样本数据,所述目标域数据集包括多个目标域样本数据,其中部分目标域样本数据具有标签;其中,所述源域样本数据包括对应用户在预定时间范围内的历史任务记录,所述目标域样本数据中不存在预定时间范围内的历史任务记录;
将各所述目标域样本数据、随机噪声和缺失特征集合输入至所述用户分类模型的预估生成网络进行处理,确定所述目标域数据集对应的模拟数据集;
根据所述模拟数据集和所述源域数据集训练所述用户分类模型中的特征生成网络、分类网络和域判别网络;
响应于所述特征生成网络、分类网络和域判别网络对应的损失函数满足预定条件,确定所述用户分类模型;
其中,所述特征生成网络用于获取所述目标域样本数据和源域样本数据的特征向量,所述分类网络用于根据所述目标域样本数据和源域样本数据的特征向量、所述源域样本数据的标签、部分所述目标域样本数据的标签确定对应的标签预测值,所述域判别网络用于调节所述目标域数据集与所述源域数据集的特征分布差异,使得所述目标域数据集与所述源域数据集进行特征对齐。
2.根据权利要求1所述的方法,其特征在于,所述标签用于表征用户在未来预定时间范围内的任务状态,所述任务状态包括用户在未来预定时间范围内会执行任务、以及用户在未来预定时间范围内不会执行任务。
3.根据权利要求1所述的方法,其特征在于,根据所述模拟数据集和所述源域数据集训练所述用户分类模型中的特征生成网络、分类网络和域判别网络包括:
将所述模拟数据集和所述源域数据集输入至所述特征生成网络,确定各所述目标域样本数据和源域样本数据对应的特征向量;
将各所述目标域样本数据和源域样本数据的特征向量输入至所述域判别网络中进行处理,确定对应的特征分布;
根据所述特征分布确定所述域判别网络对应的对抗损失;
将各所述目标域样本数据和源域样本数据的特征向量输入至所述分类网络,确定各所述目标域样本数据和源域样本数据的标签预测值;
根据具有标签的所述目标域样本数据的标签及对应的标签预测值、源域样本数据的标签及对应的标签预测值确定所述分类网络对应的分类损失;
根据具有标签的所述目标域样本数据的特征向量及对应的标签、源域样本数据的特征向量及对应的标签确定对应的对比损失;
根据所述对抗损失、所述分类损失和对比损失调节所述特征生成网络、分类网络和域判别网络的参数。
4.根据权利要求3所述的方法,其特征在于,根据所述对抗损失、所述分类损失和对比损失调节所述特征生成网络、分类网络和域判别网络的参数包括:
保持所述特征生成网络、所述分类网络和所述预估生成网络的参数,调节所述域判别网络的参数以最大化所述对抗损失;
保持所述域判别网络和所述预估生成网络的参数,调节所述特征生成网络和所述分类网络的参数以最小化所述对比损失和对抗损失;
保持所述域判别网络的参数,调节所述预估生成网络、所述特征生成网络和所述分类网络的参数以最小化所述分类损失。
5.根据权利要求3所述的方法,其特征在于,所述特征生成网络包括第一特征生成子网络、第二特征生成子网络和第三特征生成子网络;
所述第一特征生成子网络用于对所述源域样本数据进行特征处理,生成所述源域样本数据的特征向量;
所述第二特征生成子网络用于对所述模拟数据集中的模拟数据进行特征处理,生成对应的目标域样本数据的特征向量;
所述第三特征子网络用于对所述源域样本数据的特征向量和所述目标域样本数据的特征向量进行特征处理,获取预定维度的所述源域样本数据的特征向量和所述目标域样本数据的特征向量。
6.根据权利要求5所述的方法,其特征在于,所述特征生成网络包括多个第三特征生成子网络,多个所述第三特征生成子网络权值共享。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京嘀嘀无限科技发展有限公司,未经北京嘀嘀无限科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011042247.1/1.html,转载请声明来源钻瓜专利网。