[发明专利]数据处理方法及装置、电子设备及存储介质在审
申请号: | 202210386895.1 | 申请日: | 2022-04-13 |
公开(公告)号: | CN115081583A | 公开(公告)日: | 2022-09-20 |
发明(设计)人: | 李先壮;吴雪松 | 申请(专利权)人: | 北京小米移动软件有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06F16/9535 |
代理公司: | 北京善任知识产权代理有限公司 11650 | 代理人: | 李梅香;孟桂超 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 电子设备 存储 介质 | ||
1.一种数据处理方法,其特征在于,所述方法包括:
将根据用户信息以及目标信息的特征信息生成的输入向量转换为嵌入向量;
进行所述嵌入向量的向量级别变换,得到第一输出向量;
将所述嵌入向量的元素预处理后进行元素级别变换,得到第二输出向量;
根据所述第一输出向量和所述第二输出向量,确定所述目标信息的点击率预测值。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将所述嵌入向量输入到预设深度学习模型得到第三输出向量;
所述根据所述第一输出向量和所述第二输出向量,确定所述目标信息的点击率预测值,包括:
根据所述第一输出向量、所述第二输出向量及所述第三输出向量,得到所述目标信息的点击率预测值。
3.根据权利要求1或2所述的方法,其特征在于,所述进行所述嵌入向量的向量级别变换,得到第一输出向量,包括:
对所述嵌入向量进行谈话头注意力机制处理,得到所述第一输出向量。
4.根据权利要求3所述的方法,其特征在于,所述对所述嵌入向量进行谈话头注意力机制处理,得到所述第一输出向量,包括:
利用第i个谈话头对所述嵌入向量的变换向量进行线性投影,得到投影后的第一向量和第二向量;其中,所述i为小于或等于h的正整数;其中,所述h为谈话头的个数;
基于所述第一向量和第二向量的相似度,得到基于所述第i个谈话头得到的第i向量;
基于关联矩阵和第1向量至第h向量,得到更新后的第1向量至第h向量;
拼接更新后的所述第1向量至第h向量,得到谈话头注意力机制处理后的输出向量,其中,所述谈话头注意力机制处理后的输出向量用于确定所述第一输出向量。
5.根据权利要求3所述的方法,其特征在于,所述进行所述嵌入向量的向量级别变换,得到第一输出向量,还包括:
对谈话头注意力机制处理后的输出向量进行残差处理,得到残差处理后的向量;
基于所述残差处理后的向量和所述谈话头注意力机制处理后的输出向量,得到所述第一输出向量。
6.根据权利要求1或2所述的方法,其特征在于,所述将所述嵌入向量的元素预处理后进行元素级别变换,得到第二输出向量,包括:
利用对数神经元对各所述预处理后的元素j进行转换,得到第j元素的对数向量;其中,所述j为小于或等于P,其中,所述嵌入向量包含元素总个数;
利用激活层对所述第j元素的对数向量进行M次激活处理,得到所述第二输出向量;其中,所述M为正整数。
7.根据权利要求1或2所述的方法,其特征在于,所述嵌入向量的元素预处理,包括:
求取所述嵌入向量中取值为负数的绝对值;
和/或
将所述嵌入向量中取值为0的元素置为预设值。
8.根据权利要求7所述的方法,其特征在于,所述预设值为:
e-L;其中,所述L为大于或等于2的正整数。
9.一种数据处理装置,其特征在于,所述装置包括:
转换模块,用于将根据用户信息以及目标信息的特征信息生成的输入向量转换为嵌入向量;
第一输出模块,用于进行所述嵌入向量的向量级别变换,得到第一输出向量;
第二输出模块,用于将所述嵌入向量的元素预处理后进行元素级别变换,得到第二输出向量;
预测模块,用于根据所述第一输出向量和所述第二输出向量,确定所述目标信息的点击率预测值。
10.根据权利要求9所述的方法,其特征在于,所述装置还包括:
第三输出模块,用于将所述嵌入向量输入到预设深度学习模型得到第三输出向量;
所述预测模块,具体用于根据所述第一输出向量、所述第二输出向量及所述第三输出向量,得到所述目标信息的点击率预测值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小米移动软件有限公司,未经北京小米移动软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210386895.1/1.html,转载请声明来源钻瓜专利网。