[发明专利]行为预测方法、装置、电子设备及可读存储介质在审
申请号: | 202010246661.8 | 申请日: | 2020-03-31 |
公开(公告)号: | CN111539512A | 公开(公告)日: | 2020-08-14 |
发明(设计)人: | 王海涛 | 申请(专利权)人: | 北京三快在线科技有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06Q10/04 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 任亚娟 |
地址: | 100083 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 行为 预测 方法 装置 电子设备 可读 存储 介质 | ||
1.一种行为预测方法,其特征在于,所述方法包括:
获取用户的历史行为序列和一目标对象,所述历史行为序列包括至少一个历史对象;
将所述历史对象和所述目标对象输入至一行为预测模型中,得到所述用户在未来时刻对所述目标对象实施预设行为的概率;
其中,所述行为预测模型通过多个行为序列样本预先训练得到,所述行为序列样本包括:标注对象和对应的标注概率、至少两个具有时间顺序的对象样本,所述对象样本包括作为正样本的第一对象子样本和作为负样本的第二对象子样本,在对所述行为预测模型进行训练时,对所述第一对象子样本生成第二向量,对所述第二对象子样本生成第三向量,对所述第二向量和所述第三向量加权生成所述对象样本的第一向量,训练时的损失值包括根据第一时刻的第一向量、第二时刻的第二向量和第二时刻的第三向量确定的损失值,所述第一时刻早于所述第二时刻。
2.根据权利要求1所述的方法,其特征在于,所述行为预测模型包括:Embedding层、Transformer层、MLP层;在对所述行为预测模型进行训练时,将所述对象样本输入至所述Embedding层,所述Embedding层的输出输入至所述Transformer层,所述Transformer层的输出输入至所述MLP层,所述行为预测模型在训练时的损失值是根据第一损失值和第二损失值确定的,所述第一损失值是根据所述Transformer层输出的第一时刻的所述对象样本对应的第一向量、所述Embedding层输出的第二时刻的所述第一对象子样本对应的第二向量、所述Embedding层输出的第二时刻的所述第二对象子样本对应的第三向量确定的,所述第二损失值是根据所述标注对象的标注概率和所述MLP层输出的所述标注对象的预测概率确定的。
3.根据权利要求1所述的方法,其特征在于,所述第一损失值通过如下步骤确定:
根据所述Transformer层输出的第一时刻的所述对象样本对应的第一向量、所述Embedding层输出的第二时刻的所述第一对象子样本对应的第二向量,确定所述对象样本的正样本子损失值;
根据所述Transformer层输出的第一时刻的所述对象样本对应的第一向量、所述Embedding层输出的第二时刻的所述第二对象子样本对应的第三向量,确定所述对象样本的负样本子损失值;
根据所述正样本子损失值和所述负样本子损失值确定第一损失值。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述方法还包括:
根据所述历史对象在所述历史行为序列中的位置信息生成所述历史对象的位置向量;
根据所述位置向量和所述Embedding层输出的所述历史对象的第四向量,确定所述历史对象的第五向量;
将所述历史对象的第五向量输入至所述Transformer层。
5.根据权利要求1至3任一项所述的方法,其特征在于,所述方法还包括:
根据所述历史对象和前一历史对象之间的时间间隔生成所述历史对象的时间向量;
根据所述时间向量和所述Embedding层输出的所述历史对象的第四向量,确定所述历史对象的第六向量;
将所述历史对象的第六向量输入至所述Transformer层。
6.根据权利要求1所述的方法,其特征在于,所述第一对象子样本、所述第二对象子样本均输入至所述Embedding层,根据所述Embedding层对所述第一对象子样本的输出和对所述第二对象子样本的输出生成的向量输入至所述Transformer层。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010246661.8/1.html,转载请声明来源钻瓜专利网。