[发明专利]基于半监督学习的稀疏信任推荐方法在审
申请号: | 202110360307.2 | 申请日: | 2021-04-02 |
公开(公告)号: | CN113065918A | 公开(公告)日: | 2021-07-02 |
发明(设计)人: | 聂鹏丽;许光全;吴斌;赵煜阳;王炜喆;冯美琪 | 申请(专利权)人: | 天津大学 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06F16/9536;G06K9/62 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 刘国威 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 监督 学习 稀疏 信任 推荐 方法 | ||
1.一种基于半监督学习的稀疏信任推荐方法,其特征是,将影响信任建立的因素分解为相似性、一致性、可靠性、客观性这四个因子,之后利用直推式支持向量机TSVM用以结合所述四个因子,进而挖掘用户之间的稀疏信任;通过共享相同的用户特征空间将社会信任与稀疏信任合并到奇异值分解SVD++推荐模型当中,并通过信任平衡参数α来控制稀疏信任与社会信任之间的比重,进而利用改进的奇异值分解推荐模型最终实现推荐。
2.如权利要求1所述的基于半监督学习的稀疏信任推荐方法,其特征是,所述四个因子具体定义如下:
1)相似性即用户们之间偏好的共性,采用杰卡德相似系数来计算用户们之间的相似性,如公式(1)所示:
其中Iu和Iv分别表示用户u和用户v所评级过的物品的集合,其中Iu∩Iv为用户u和用户v评价过物品的交集,而Iu∪Iv为用户u和用户v评价过物品的并集;
2)一致性指的是施信者与受信者之间评价习惯与评价指标的综合性考量指标,计算公式如(2)所示:
其中和分别表示用户u和用户v的在所有项目上的平均评分。
3)可信度是指对用户行为的评价是否诚实,可信性由公式(3)计算:
其中C1表示了用户v评分习惯的波动性;C2表示了用户v在各个物品上的评分与相应物品平均评分的差异;表示物品i的平均评分;N表示用户v所评价过的物品的总数。用户的活跃度l可以由公式(4)表示:
其中Nu为活跃用户所需评价过的物品数量的最小值,用户的可信性最终由公式(5)表示:
4)客观性是指用户的评价是否与客观事实相一致,用户的客观性由公式(6)表示:
其中r表示所有商品的平均评分;
在形式上,稀疏信任影响因素集可表示为Au,v={Sim(u,v),Con(u,v),Cre(v),
Obj(v)};
5)稀疏信任挖掘:将信任关系分为了三种状态,即信任:tu,v=1,不信任:tu,v=-1,以及信任关系不明;然后利用直推式支持向量机TSVM算法,稀疏信任挖掘过程如下:
给定训练集Dl={(x1,y1),(x2,y2),...,(xl,yl)}和Du={xl+1,xl+2,...,xl+u},其中xi表示第i个稀疏信任关系的影响因素特征向量,第i个稀疏信任关系是用户两两组合后排在第i个的向量;yi∈{-1,+1}表示第i个稀疏信任关系的信任标签,其中l<<u,l+u=k,k=m×m。例如,假设第i个稀疏信任关系是由用户u指向用户v的信任关系,TSVM算法的学习目标是给出Du中的未标记的信任数据的伪标签所以TSVM的损失函数由公式(7)所示:
s.t yi(wTxi+b)≥1-ξi,i=1,2,...l,
ξi≥0,i=1,2,...m (4-7)
其中ξ为松弛变量,Cl和Cu为我们人为设置的参数用来平衡稀疏信任挖掘模型的复杂性和样本的重要性。
3.如权利要求1所述的基于半监督学习的稀疏信任推荐方法,其特征是,通过共享相同的用户特征空间将社会信任与稀疏信任合并到奇异值分解推荐模型当中,并通过信任平衡参数α来控制稀疏信任与社会信任之间的比重,进而利用奇异值分解推荐模型最终实现推荐,具体过程如下:基于SVD++模型,在SVD++模型中用户u对于物品i的预测评分可由公式(8)预测:
其中向量bi表示第i项物品的平均评分与所有物品平均评分的偏差,向量bu表示用户u对物品的平均评分与所有物品的平均评分的偏差,并且μ表示系统中所有物品的平均评分,yi表示了用户u所评价的其他的物品在物品i上所造成的影响因素,用户隐式特征矩阵pu可以被用户特征和它们对每个特征的评价项的效果之和所代替,即
在稀疏信任和社会信任的共同影响下扩展SVD++模型。所以用户u对于物品i的预测评分由公式(9)计算:
其中Tu和Su分别表示用户u在社会信任网络和稀疏信任网络中所信任的用户的集合;wv和fz分别是用户u在社会信任网络和稀疏信任网络中所信任的用户的特征向量,参数α表示此推荐模型中社会信任和稀疏信任的权重;
使用表示用户u在社会信任网络中所信任的用户对其造成的影响,使用表示用户u在稀疏信任网络中所信任的用户对其造成的影响,受信者对施信者在评分上的影响可以建模为因此,目标函数由公式(10)所示:
矩阵分解模型,需要最小化的目标函数如式公式(11)所示:
其中a和b分别是社会信任网络和稀疏信任网络中的信任约束,参数c和d用于控制信任正则化的程度。
为了避免过度拟合,给出需要最小化的最终损失函数如公式(12)所示:
其中Ui和Uj分别为评价过物品i和物品j的用户的集合;Tv+表示在社会信任网络中信任用户u的用户们的集合;表示在稀疏信任网络中信任用户z的用户们的集合;
对于所有用户和物品,通过执行对bu,bi,pu,qi,yi,wv和fz的梯度下降,获得公式(12)所能取得的最小值,梯度下降过程如公式(13)所示:
其中为用户评价的误差式;为在社会信任网络中用户u指向用户v的信任误差式;为在稀疏信任网络中用户u指向用户z的信任误差式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110360307.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种智能型金属铸造用冷却装置
- 下一篇:一种基于区块链的履历管理方法