[发明专利]一种基于深度学习的多目标优化推荐方法在审
申请号: | 202211189380.9 | 申请日: | 2022-09-28 |
公开(公告)号: | CN115510322A | 公开(公告)日: | 2022-12-23 |
发明(设计)人: | 刘萍萍;路萍;张敏;陈言训 | 申请(专利权)人: | 西安工业大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06N3/04;G06N3/08 |
代理公司: | 西安新思维专利商标事务所有限公司 61114 | 代理人: | 李凤鸣 |
地址: | 710032 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 多目标 优化 推荐 方法 | ||
1.一种基于深度学习的多目标优化推荐方法,其特征在于:所述方法具体包括以下步骤:
步骤1:对原始视频推荐数据进行数据预处理与分类,建立训练及测试数据集,并设立模型学习目标;
步骤2:引入Embedding层解决数据特征稀疏性;
步骤3:构建高低阶特征交互,对CTR进行预测;
步骤4:为每个目标引入单独的门控网络;
步骤5:引入多级专家网络,使每个目标有独立的Expert,同时保留了共享的Expert;
步骤6:建立目标之间依赖关系,构建加权多目标损失。
2.根据权利要求1所述的一种基于深度学习的多目标优化推荐方法,其特征在于:所述步骤1包括以下步骤:
步骤1.1:原始视频推荐数据的获取采集用户在视频网站连续15天的用户日志,数据包括用户特征,视频内容特征,以及用户历史行为数据,且全部经过脱敏处理,得到数据标签;
步骤1.2:数据预处理与分类分析各个数据标签在曝光场景与点击场景中的比重,并对其中的视频时长标签进行统计分析,将范围为0-9的时长标签设置阈值为4,将时长标签大于4的设为有效时长,其他设为无效时长,得到训练及测试数据集;
步骤1.3:设立模型学习目标选取数据标签中的点击标签和视频时长标签作为模型将要学习的两个目标。
3.根据权利要求2所述的一种基于深度学习的多目标优化推荐方法,其特征在于:所述步骤2中,Embedding layer层为嵌入层,用于对高维稀疏的one-hot数据向量做嵌入,得到低维稠密的Embedding向量,然后将通过嵌入层后得到的每个稠密向量横向拼接,作为模型的输入;嵌入层的输出表示为:
a(0)=[e1,e2,...,em]
其中ei是第i个字段的嵌入,m是字段数。然后,a(0)被送入深度神经网络,前向传播过程为:
a(l+1)=σ(W(l)a(l)+b(l))
其中l是层深度,σ是激活函数,a(l),W(l),b(l)分别是第l层的输出、模型权重和偏差,之后,生成一个稠密的实值特征向量。
4.根据权利要求3所述的一种基于深度学习的多目标优化推荐方法,其特征在于:所述步骤3包括以下步骤:
步骤3.1:构建高低阶特征交互
首先分别采用因子分解机和深度神经网络建模低层次和高层次的特征交互,把DeepFM的FM部分保留不变,把DeepFM的DNN部分换为硬参数共享的Shared-Bottom结构,得到结合DeepFM和Shared-Bottom的多目标基础模型;
步骤3.2:对CTR进行预测
FM子网络计算稀疏特征和稠密特征的二阶交叉分数,deep子网络将稠密特征和连续特征拼接输入进网络;将FM一阶、二阶分数和deep的最后一层输入拼接,经过sigmoid得到CTR的预估值。
5.根据权利要求4所述的一种基于深度学习的多目标优化推荐方法,其特征在于:所述步骤4中,对每个目标k都添加一个单独的门控网络gk,任务k的输出为:
yk=hk(fk(x))
门控网络针对各自的目标学习experts网络的不同组合模式,对experts网络的输出进行自适应加权。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安工业大学,未经西安工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211189380.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种五金精密切割设备及其方法
- 下一篇:一种锚杆框架梁模板系统及其施工方法