[发明专利]一种基于深度游走词向量图嵌入技术的预测方法在审
申请号: | 202111597115.X | 申请日: | 2021-12-24 |
公开(公告)号: | CN114493657A | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 项亮;潘信法 | 申请(专利权)人: | 上海数鸣人工智能科技有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06N3/04;G06N3/08 |
代理公司: | 上海天辰知识产权代理事务所(特殊普通合伙) 31275 | 代理人: | 吴世华;尹一凡 |
地址: | 200436 上海市静安*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 游走 向量 嵌入 技术 预测 方法 | ||
1.一种基于深度游走词向量图嵌入技术的预测方法,其特征在于,包括据预处理步骤S1、基于深度游走对用户访问DPI序列图嵌入生成步骤S2和预测模型建立步骤S3;
所述数据预处理步骤S1包括如下步骤:
步骤S11:获取N个用户的原始信息,并从所述用户的原始信息提取原始特征信息;其中,所述原始特征信息包括用户ID、用户手机号码归属地、用户访问DPI序列、用户访问时间和/或用户是否点击特征;其中,所述用户号码归属地为类别特征,所述用户访问时间为连续特征,所述N大于等于2;
步骤S12:对所述用户的原始信息进行异常检测与处理步骤;
步骤S13:对用户ID进行分组后,再对所述用户访问时间排序,给出按照所述用户访问时间先后的第一用户访问DPI序列;
步骤S14:通过独热编码对类别特征进行处理,利用RankGauss方法对连续特征进行处理;
所述步骤S2包括:
S21:获取/生成用户点击行为第一用户访问DPI序列;
S22:根据所有用户点击行为的第一用户访问DPI序列,生成每一条由用户先点击或访问的DPI指向后点击或访问的DPI2的有向边,并根据每一条有向边所产生的数量加权,形成DPI关系图;
S23:使用随机游走的方式随机选择初始点,对生成的DPI关系图中的DPI节点进行采样并生成对应的第二用户访问DPI序列;
S24:采用Skip-Gram方法产生第一用户访问DPI序列和第二用户访问DPI序列的图嵌入表示;
所述预测模型产生步骤S3用于基于深度游走词向量图嵌入技术的活动预测模型,所述预测模型包括输入层、嵌入层、合并层、全连接层和输出层;使用所述训练集对所述预测模型进行训练,并使用验证集进行验证,得到最终的预测模型,包括如下步骤:
步骤S31:提供初始化的基于深度游走对用户访问DPI序列图嵌入模型;将N个用户的原始的N个用户的第一用户访问DPI序列以及N个所述用户的第二用户访问DPI序列,按用户ID划分成训练集和验证集;其中,第二用户访问DPI序列是根据第一用户访问DPI序列相应用户ID通过DeepWalk生成算法输出的新DPI访问序列;
步骤S32:依次将所述训练集中每一个用户ID名下的第一用户访问DPI序列和第二用户访问DPI序列拼接输入到输入层;
步骤S33:所述嵌入层采用Skip-Gram方法产生对应DPI节点的第一用户访问DPI序列和第二用户访问DPI序列图嵌入表示;
步骤S34:所述合并层接收所述嵌入层的输出,将所述第一用户访问DPI序列和第二用户访问DPI序列图嵌入表示特征拼接起来;
步骤S35:所述全连接层接收所述合并层的输出,进行全连接的网络训练;
步骤S36:所述输出层通过添加sigmoid函数即可输出二分类用户点击预测的概率,通过划定阈值即可表示为0/1二分类,并通过划定阈值形成为点击或不点击的二分类问题,即划分为正标签或负标签的输出结果;
步骤S37:通过所述的预测值,计算所述预测网络模型的预测值和真实值之间的损失值大小,根据损失值按照深度学习的梯度回传自动更新所述预测网络模型中所有涉及到的网络参数,并使用验证集进行验证,得到最终的预测网络模型。
2.根据权利要求1所述的预测方法,其特征在于,所述步骤S22包括如下步骤:
步骤S221:根据用户点击行为的第一用户访问DPI序列,各个DPI的关系图可按照如下方式生成:
用户U1先后点击或访问了DPI1和DPI2,则产生一条由DPI1指向DPI2的有向边,即DPI1→DPI2;如果有其他用户也产生了相同的访问行为,则由DPI1指向DPI2的权重被加强,最终将产生所有DPI的关系图。
3.根据权利要求1所述的预测方法,其特征在于,所述S23中的使用随机游走的方式为DPI关系图中的深度优先搜索和广度优先搜索。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海数鸣人工智能科技有限公司,未经上海数鸣人工智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111597115.X/1.html,转载请声明来源钻瓜专利网。