[发明专利]一种面向用户动态偏好挖掘的节目嵌入方法在审
申请号: | 201811322845.7 | 申请日: | 2018-11-08 |
公开(公告)号: | CN109460427A | 公开(公告)日: | 2019-03-12 |
发明(设计)人: | 温雯;林泽钿;蔡瑞初;郝志峰;陈炳丰 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458 |
代理公司: | 广州市红荔专利代理有限公司 44214 | 代理人: | 吴伟文 |
地址: | 510006 *** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 向量 嵌入 输入特征向量 节目特征 面向用户 用户偏好 节目 低维 偏好 刻画 训练样本集 点击行为 节目向量 目标节目 时间区间 输出特征 条件概率 向量表示 影响因子 用户行为 挖掘 初始化 固定的 稀疏性 序列集 有效地 最大化 读入 建模 降维 稠密 舍弃 优化 改进 学习 | ||
1.一种面向用户动态偏好挖掘的节目嵌入方法,其特征在于,包括以下步骤:
S1)、读入点击行为序列集S;
S2)、将点击节目表示为低维向量,并初始化输入特征向量和输出特征向量,特征向量的维度大小由用户指定;其中,每个节目包括一个输入特征向量和一个输出特征向量;
S3)、根据序列集S构建训练样本集;
S4)、然后使用训练样本集对节目特征向量进行优化;
S5)、输出优化后的节目输入和输出特征向量表示;
S6)、结合用户当前时刻的上下文节目的输入特征向量,刻画用户当前时刻的兴趣。
2.根据权利要求1所述的一种面向用户动态偏好挖掘的节目嵌入方法,其特征在于:步骤S3)中,构建训练样本集,具体包括以下步骤:
S301)、初始化正样本集合D+和负样本集合D-;
S302)、对行为序列集S中的每个序列si,依次取出一个节目作为目标节目ti;
S303)、根据目标节目ti使用滑动窗口向前回溯w个节目作为上下文;
S304)、对于上下文中的每个节目tj与目标节目ti构建三元组(tj,ti,1),并添加到正样本集合D+中;
S305)、重复步骤S302)-S304),直至处理完行为序列集S中的每个系列;
S306)、从上述步骤生产的正样本集合D+中,依次取出一个三元组,记为(tj,ti,1);
S307)、对于每个三元组(tj,ti,1),从节目集T中随机采样N个节目,其中N为负样个数,由用户指定,抽取的每个节目tr与tj组成一个三元组(tj,tr,1)作为(tj,ti,1)对应的负样本,并将其添加到负样本集合D-中;
S308)、重复步骤S306)、S307),直至处理完正样本集合D+中的每个三元组;
S309)、合并正样本集合D+和负样本集合D-,和并后得到的集合D即为训练样本集。
3.根据权利要求1所述的一种面向用户动态偏好挖掘的节目嵌入方法,其特征在于:步骤S4)中,对节目特征向量进行优化,具体为:首先利用将每个点击行为序列当成一个“句子”,然后遍历每一个“句子”构建训练样本集,并通过每一个训练样本调整节目向量,使得最大化条件概率P(目标节目|上下文节目)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811322845.7/1.html,转载请声明来源钻瓜专利网。