[发明专利]一种相似性度量的方法以及系统有效
申请号: | 201410267170.6 | 申请日: | 2014-06-16 |
公开(公告)号: | CN104063445B | 公开(公告)日: | 2017-04-26 |
发明(设计)人: | 朱宝 | 申请(专利权)人: | 百度移信网络技术(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京志霖律师事务所11575 | 代理人: | 潘士霖 |
地址: | 100085 北京市海淀区农大南路1号院4号*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 相似性 度量 方法 以及 系统 | ||
技术领域
本发明涉及信息处理领域,特别涉及信息处理领域中的相似性度量的方法以及系统。
背景技术
当前,在众多领域均涉及相似性度量,并基于各种已有的相似性度量方法进行相似性分析。例如在互联网行业等领域所涉及的相似性度量。
现有的进行相似性度量包括以下两类。一种基于行为数据。如矩阵分解、协同过滤等技术中计算物体相似度的方法。一种是基于特征数据计算相似度,利用用户行为进行特征相似度学习,如遗传算法等。但是上述的算法都存在以下问题,或者只考虑行为数据计算相似度,或者只考虑物体特征进行相似度计算。没有能够将行为数据和特征数据进行综合利用,以求出最佳的相似度结果。
发明内容
本发明就是鉴于上述问题而完成的,其目的在于提供一种将基于物体特征的相似性结果和基于行为数据的相似性结果进行有效综合基于相似性度量的方法和系统。
本发明涉及的一种相似性度量方法,包括以下步骤:数据获取步骤,获取关于用户的行为数据以及物品的特征数据;基于行为数据的相似度计算步骤,计算基于行为数据的物品和物品之间的相似度;基于特征数据的相似度计算步骤,计算基于特征数据的物品和物品之间的相似度;以及相似度综合步骤,将基于行为数据所得到的相似度与基于特征数据所得到的相似度利用以下的贝叶斯公式进行综合,
其中,bi、bj表示物品,下标变量i=1,2……,先验概率密度sim′(bi,bj)为基于特征数据的的物品bi和物品bj之间的相似度结果,条件概率密度sim"(bj,bi)为基于行为数据的物品bj和物品bi相似度结果,sim″′(bi,bj)表示进行了相似度综合的物品bi和物品bj之间的贝叶斯相似度。
根据上述的相似性度量方法,可以是在所述基于行为数据的相似度计算步骤中,包括以下步骤:利用获取的所述行为数据生成用户和物品之间的关系矩阵、以及物品和用户之间的关系矩阵;利用所述用户和物品之间的关系矩阵和所述物品和用户之间的关系矩阵生成用户对物品的概率矩阵、以及物品对用户的概率矩阵;对所述物品对用户的概率矩阵和用户对物品的概率矩阵进行相乘以计算出物品和物品之间的相似度矩阵。
根据上述的相似性度量方法,也可以是在所述基于行为数据的相似度计算步骤中,利用所获取用户集合中的用户a和物品集合中的物品b、以及用户集合中的用户a对物品集合中的物品b无差别的相似性操作次数sim(a,b),执行基于下式的物品集合内部物品bj与物品bi的相似性值sim″(bj,bi)的计算,以生成相似度矩阵,
其中,i,j,m,n表示集合中元素的标号,k是归一化因子。
根据上述的相似性度量方法,可以是针对所述相似度矩阵利用计算所述相似度矩阵的方法再次进行计算,以得到增强相似度关联的物品和物品之间的增强相似度矩阵来作为所述行为数据的物品bj和物品bi相似度结果。
根据上述的相似性度量方法,可以是在计算基于行为数据的相似度之前还包括白噪声补偿步骤:将用户对物品操作的次数低于预定次数的用户补充至预定次数。
根据上述的相似性度量方法,可以是在所述基于特征数据的相似度计算步骤中,包括以下步骤:利用获取的所述特征数据生成物品和属性之间的关系矩阵、以及属性和物品之间的关系矩阵;利用所述物品和属性之间的关系矩阵和所述属性和物品之间的关系矩阵生成物品对属性的概率矩阵、以及属性对物品的概率矩阵;对所述物品对属性的概率矩阵和属性对物品的概率矩阵进行相乘以计算出物品和物品之间的相似度矩阵。
根据上述的相似性度量方法,可以是在所述基于特征数据的相似度计算步骤中,包括以下步骤:利用所获取物品集合中的物品a和属性集合中的已知属性c、以及属性集合中的已知属性c与物品集合中的物品b的对应属性值sim(c,b),执行基于下式的物品集合内部物品bi与物品bj的相似性值sim′(bi,bj)的计算,以生成针对已知属性的物品和物品之间的相似度矩阵,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度移信网络技术(北京)有限公司,未经百度移信网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410267170.6/2.html,转载请声明来源钻瓜专利网。