[发明专利]融入用户画像与社交关系相似度的数字商务智能跨域推荐方法在审
申请号: | 202110994949.8 | 申请日: | 2021-08-27 |
公开(公告)号: | CN113806633A | 公开(公告)日: | 2021-12-17 |
发明(设计)人: | 郭飞鹏;周伟;卢琦蓓 | 申请(专利权)人: | 浙江工商大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/9536;G06Q10/06;G06Q10/10;G06Q30/02;G06Q30/06;G06Q50/00 |
代理公司: | 杭州天正专利事务所有限公司 33201 | 代理人: | 王兵 |
地址: | 310018 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 融入 用户 画像 社交 关系 相似 数字 商务 智能 推荐 方法 | ||
1.融入用户画像与社交关系相似度的数字商务智能跨域推荐方法,包括以下步骤:
步骤1,计算数字商务(目标域)的用户画像相似度,考虑到用户画像中包含用户对项目类型的偏好程度以及用户的基本信息,利用二进制(0,1)标量将上述信息进行融合,并计算用户画像的相似度;
输入:用户项目评分矩阵,用户年龄、性别;
输出:用户画像相似度
具体包括:
步骤11:用户-项目评分矩阵之中,每个项目均具有特定的类型Gg;首先针对用户已评分的各项目中评分较高的项目类型,分别计算相对类型评分RGR,及修正的相对类型频率MRGF,在此基础上,获取用户对各类型项目的偏好程度UP(u,g):
其中,TR(u)是用户u对项目的评分之和,GR(u,g)是用户u对类型Gg高评分的集合(如1-5分的评分范围中,>=3即算高评分),Su是用户u评分的项目集,Si是用户u评分的项目个数,即若用户对项目的评分为k时则δk(r(u,s))取值为1,否则为0,nf为归一化因子,是各项系数平方和的平方根,即
步骤12:提取目标域中用户的年龄和性别信息,并利用二进制0-1标量对其进行向量化表示;将年龄分段为(1-17,18-24,25-34,35-44,45-49,50-55,56+),用户年龄处于某个阶段则将其标为1,性别则将男标为1,女标为0;
步骤13:计算好上述两种信息后,将两个向量进行联合,得到用户画像向量Pk,以此计算出目标域中任意两个用户间的用户画像相似度:
步骤2,为了进一步提升跨域用户间相似度计算的可靠性,融合社交网络(源域)和数字商务(目标域)的用户相似度;利用域间重叠用户的社交网络,计算用户社交关系相似度;为了提升社交网络中的用户关系相似度的准确性,基于共同邻居相似度的链路预测算法,融入用户社交中的潜在关系,即用户的二阶邻居,提出基于一阶、二阶共同邻居用户社交关系相似度的链路预测算法;
输入:社交网络用户连接图G(V,E);
输出:用户社交关系相似度DICNij;
具体包括:
步骤21:对比源域中与目标域重叠的用户z与用户i的连接关系,并赋予邻域向量Ni不同的值;具体包括:(1)用户z即用户i,Ni为di;(2)用户z为用户i的二阶邻居,Ni为CNiz;(3)用户z为用户i的一阶邻居,Ni为CNiz+1;(4)用户z与用户i既不是一阶邻居,也不是二阶邻居,邻域为0,由等式可表示为:
其中,di代表用户i的度,CNiz=|Γi∩Γz|代表一阶共同邻居相似度,Γk代表节点k的一阶邻居集合;
步骤22:为了评估用户i与用户j之间的相似度,它们的并集邻域集UNij计算为:
UNij={z|(Ni[z]>0)Or(Nj[z]>0)}# (6)
步骤23:利用皮尔逊相关系数计算用户间的二阶邻居相关性:
其中,为邻域向量Ni的并集邻域集UNij的均值,可由下式得到:
步骤24:进一步融合一阶邻居与二阶邻居的相似度,计算源域中任意两个用户间的用户社交关系相似度:
DICNij=(1+CNij)(1+Corrij)# (9)
步骤3,将用户画像相似度、用户社交关系相似度进行加权融合,得到跨域中重叠用户的综合相似度,并建立概率图模型,运用概率矩阵分解,利用联合分布、条件分布、乘积规则等建立目标函数,以及交替最小二乘法对损失函数进行学习更新,最终完成跨域评分预测:
输入:用户画像相似度与用户社交关系相似度DICNij,目标领域评分矩阵Rij;
输出:预测用户评分矩阵
具体包括:
步骤31:将上述基于源域和目标域分别得到的用户社交关系相似度和用户画像相似度进行加权融合,得到用户综合相似度;其中α∈(0,1),为调谐参数,可针对不同数据集取不同的值,实现最优预测:
接着将目标域的评分矩阵R进行概率矩阵分解,得到用户潜在特征向量Ut,项目潜在特征向量Vt:
Rij=Ut×Vt# (11)
步骤32:将各变量绘制成概率图模型,并利用图模型理论得到各变量的联合分布,然后,忽略常数的先验概率,并在潜在变量加上对数后得到对数后验概率:
其中,代表变量ζ的方差;
步骤33:依据独立同分布,分别得到评分矩阵R、用户综合相似度S的条件概率密度;对于用户、项目潜在特征向量,假设均服从正态分布,则有均值为0的球形高斯先验:
其中,表示均值为μ,方差为的正态分布;是指标函数,若用户i在目标域中对项目j进行了评分,则其为1,否则为0;然后将上述公式代入式(13)可得:
其中,C是不依赖参数的常量,将式(18)采用对数似然估计,得到代价函数如下;
步骤34:假设各变量的方差相等,即最大化式(19)的似然等价于最小化下述二次优化目标的函数:
其中,λU,λV是为了避免过拟合所设的恒定的折衷参数和惩罚参数的大小,λS同样是用来约束用户相似度影响的恒定的折衷参数;
接着对参数Ut、Vt进行损失函数求解,并分别求偏导,且令其为零,得到参数各自的梯度;
接着以此进行参数学习,直至收敛到局部最优;γ是目标函数的学习率;
步骤35:通过上述的计算,对目标函数中的2个参数Ut与Vt学习完毕后,依此进行评分矩阵预测:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工商大学,未经浙江工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110994949.8/1.html,转载请声明来源钻瓜专利网。