[发明专利]数据处理方法及装置、电子设备及存储介质在审
申请号: | 202210386895.1 | 申请日: | 2022-04-13 |
公开(公告)号: | CN115081583A | 公开(公告)日: | 2022-09-20 |
发明(设计)人: | 李先壮;吴雪松 | 申请(专利权)人: | 北京小米移动软件有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06F16/9535 |
代理公司: | 北京善任知识产权代理有限公司 11650 | 代理人: | 李梅香;孟桂超 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 电子设备 存储 介质 | ||
本公开是关于一种数据处理方法及装置、电子设备及存储介质。所述数据处理方法可包括:将根据用户信息以及目标信息的特征信息生成的输入向量转换为嵌入向量;进行所述嵌入向量的向量级别变换,得到第一输出向量;将所述嵌入向量的元素预处理后进行元素级别变换,得到第二输出向量;根据所述第一输出向量和所述第二输出向量,确定所述目标信息的点击率预测值。
技术领域
本公开涉及信息技术领域,尤其涉及一种数据处理方法及装置、电子设备及存储介质。
背景技术
随着信息技术和网络技术的发展,出于内容推广和用户的信息检索需求,大量的内容生产者,会在网络中进行内容投放。
在进行内容投放时,一方面为了减少对用户的信息干扰,另一方面为了减少乱投放消耗的网络资源,因此需要进行内容投放相关的预测操作。
示例性地,该预测操作可包括:预测内容投放的点击率,然后根据预测的点击率选择内容投放的位置和/或投放用户。而这种场景下,精确地得到预测点击率就显得十分重要了。
发明内容
本公开提供一种数据处理方法及装置、电子设备及存储介质。
本公开实施例第一方面提供一种数据处理方法,所述方法包括:
将根据用户信息以及目标信息的特征信息生成的输入向量转换为嵌入向量;
进行所述嵌入向量的向量级别变换,得到第一输出向量;
将所述嵌入向量的元素预处理后进行元素级别变换,得到第二输出向量;
根据所述第一输出向量和所述第二输出向量,确定所述目标信息的点击率预测值。
基于上述方案,所述方法还包括:
将所述嵌入向量输入到预设深度学习模型得到第三输出向量;
所述根据所述第一输出向量和所述第二输出向量,确定所述目标信息的点击率预测值,包括:
根据所述第一输出向量、所述第二输出向量及所述第三输出向量,得到所述目标信息的点击率预测值。
基于上述方案,所述进行所述嵌入向量的向量级别变换,得到第一输出向量,包括:
对所述嵌入向量进行谈话头注意力机制处理,得到所述第一输出向量。
基于上述方案,所述对所述嵌入向量进行谈话头注意力机制处理,得到所述第一输出向量,包括:
利用第i个谈话头对所述嵌入向量的变换向量进行线性投影,得到投影后的第一向量和第二向量;其中,所述i为小于或等于h的正整数;其中,所述h为谈话头的个数;
基于所述第一向量和第二向量的相似度,得到基于所述第i个谈话头得到的第i向量;
基于关联矩阵和第1向量至第h向量,得到更新后的第1向量至第h向量;
拼接更新后的所述第1向量至第h向量,得到谈话头注意力机制处理后的输出向量,其中,所述谈话头注意力机制处理后的输出向量用于确定所述第一输出向量。
基于上述方案,所述进行所述嵌入向量的向量级别变换,得到第一输出向量,还包括:
对谈话头注意力机制处理后的输出向量进行残差处理,得到残差处理后的向量;
基于所述残差处理后的向量和所述谈话头注意力机制处理后的输出向量,得到所述第一输出向量。
基于上述方案,所述将所述嵌入向量的元素预处理后进行元素级别变换,得到第二输出向量,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小米移动软件有限公司,未经北京小米移动软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210386895.1/2.html,转载请声明来源钻瓜专利网。