[发明专利]数据处理方法、装置、电子设备及计算机可读存储介质有效

专利信息
申请号: 202010247366.4 申请日: 2020-03-31
公开(公告)号: CN111460302B 公开(公告)日: 2023-08-08
发明(设计)人: 周瑜;赵彬杰;臧云飞 申请(专利权)人: 拉扎斯网络科技(上海)有限公司
主分类号: G06F16/9535 分类号: G06F16/9535;G06N3/0464;G06N3/08
代理公司: 北京智信四方知识产权代理有限公司 11519 代理人: 吕雁葭;宋海龙
地址: 200333 上海*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 数据处理 方法 装置 电子设备 计算机 可读 存储 介质
【说明书】:

本公开实施例公开了一种数据处理方法、装置、电子设备及计算机可读存储介质,所述数据处理方法包括获取用户的输入文本数据和N个历史行为文本数据,其中,所述历史行为文本数据对应于所述用户的历史行为,N为大于等于1的整数;通过处理器利用第一模型获取与所述输入文本数据相对应的第一文本语义向量和分别与所述N个历史行为文本数据相对应的N个第二文本语义向量;通过处理器根据所述N个第二文本语义向量,利用一个第二模型或串联的多个第二模型获取N个第三文本语义向量Csubgt;i/subgt;,i=1~N;通过处理器根据所述第一文本语义向量和所述N个第三文本语义向量Csubgt;i/subgt;,获取所述用户的兴趣向量,使获取的用户的兴趣向量可以更准确地表达用户的当前兴趣。

技术领域

本公开涉及计算机应用技术领域,具体涉及一种数据处理方法、装置、电子设备及计算机可读存储介质。

背景技术

随着互联网技术的发展,互联网平台会采用推荐模型确定用户可能感兴趣的内容并推荐给用户。例如,在推荐模型中,通过用户的兴趣特征来表征用户兴趣,在推荐模型中引入兴趣特征可以增强推荐模型不同样本之间的区分度,从而提高推荐模型的准确度。现有技术一般基于用户的历史行为确定用户的兴趣特征,但是用户行为会受做出行为的时间、地点、正在使用的应用程序以及曝光内容等因素的影响,即用户的历史行为往往不能准确地反映用户的当前偏好,因此,如何基于用户行为获取有效的用户兴趣特征成为亟待解决的问题。

发明内容

为了解决相关技术中的问题,本公开实施例提供一种数据处理方法、装置、电子设备及计算机可读存储介质。

第一方面,本公开实施例中提供了一种数据处理方法。

具体地,所述数据处理方法,包括:

获取用户的输入文本数据和N个历史行为文本数据,其中,所述历史行为文本数据对应于所述用户的历史行为,N为大于等于1的整数;

通过处理器利用第一模型获取与所述输入文本数据相对应的第一文本语义向量和分别与所述N个历史行为文本数据相对应的N个第二文本语义向量;

通过处理器根据所述N个第二文本语义向量,利用一个第二模型或串联的多个第二模型获取N个第三文本语义向量Ci,i=1~N;

通过处理器根据所述第一文本语义向量和所述N个第三文本语义向量Ci,获取所述用户的兴趣向量。

结合第一方面,本公开在第一方面的第一种实现方式中,所述获取用户的输入文本数据和N个历史行为文本数据,包括:

获取所述用户的所述输入文本数据;

基于所述输入文本数据,确定所述N个历史行为文本数据。

结合第一方面的第一种实现方式,本公开在第一方面的第二种实现方式中,所述基于所述输入文本数据,确定所述N个历史行为文本数据,包括:

获取所述用户在预设历史时间段内的M个候选历史行为文本数据,M为大于等于N的整数;

根据所述输入文本数据与所述M个候选历史行为文本数据的相关度,将所述M个候选历史行为文本数据中的N个候选历史行为文本数据确定为所述N个历史行为文本数据。

结合第一方面,本公开在第一方面的第三种实现方式中,所述第一模型包括以下模型中任意一个模型:Word2vector模型、Item2vector模型、BERT模型。

结合第一方面,本公开在第一方面的第四种实现方式中,所述第二模型包括沿所述第二模型的输入到输出方向依次连接的第一线性层、第一多头注意力层、第一残差归一化层、第一前馈神经网络层和第二残差归一化层,其中,所述第一多头注意力层包括沿所述第一多头注意力层的输入到输出方向依次连接的第一子线性层、点积注意力层、第一拼接层和第二子线性层。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于拉扎斯网络科技(上海)有限公司,未经拉扎斯网络科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010247366.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top