[发明专利]一种相似性度量的方法以及系统有效
申请号: | 201410244546.1 | 申请日: | 2014-06-04 |
公开(公告)号: | CN104111969B | 公开(公告)日: | 2017-06-20 |
发明(设计)人: | 朱宝 | 申请(专利权)人: | 百度移信网络技术(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京志霖律师事务所11575 | 代理人: | 潘士霖 |
地址: | 100085 北京市海淀区农大南路1号院4号*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 相似性 度量 方法 以及 系统 | ||
1.一种相似性度量方法,其特征在于,包括以下步骤:
收集用户访问物品的行为,并获取用户、物品、以及用户对物品的操作行为的数据;
对获取的数据进行分析以建立用户与物品之间交互关系矩阵;
根据所述用户与物品之间交互关系矩阵,针对每个用户,计算出物品被所述每个用户操作的次数相对于所述物品被所有用户操作的次数的概率,生成与所述用户与物品之间交互关系矩阵对应的物品相对于用户的概率矩阵;
根据所述用户与物品之间交互关系矩阵,针对每个物品,计算出用户操作所述每个物品的次数相对于所述用户操作所有物品的次数的概率,生成与所述用户与物品之间交互关系矩阵对应的用户相对于物品的概率矩阵;
计算所述物品相对于用户的概率矩阵与所述用户相对于物品的概率矩阵的乘积,得到用户与用户之间的相似度矩阵。
2.根据权利要求1所述的相似性度量方法,其特征在于,
所述物品相对于用户的概率矩阵中概率的概率密度是服从相同方差的正态分布密度,所述用户相对于物品的概率矩阵中概率的概率密度是服从相同方差的正态分布密度。
3.根据权利要求1或2所述的相似性度量方法,其特征在于,
计算所述用户相对于物品的概率矩阵与所述物品相对于用户的概率矩阵的乘积,得到物品与物品之间的相似度矩阵。
4.一种相似性度量方法,其特征在于,包括以下步骤:
收集用户访问物品的行为,并获取用户、物品、以及用户对物品的操作行为的数据;
对获取的数据进行分析以建立用户与物品之间交互关系矩阵;
根据所述用户与物品之间交互关系矩阵,以用户为行,依次将各物品被该用户的操作次数除以该用户进行过的操作总次数来得到与所述用户与物品之间交互关系矩阵对应的物品相对于用户的概率矩阵,如果所述用户没有操作任何物品,则每个物品被所述用户操作的概率取满足元素值都相同且和为1的值;
根据所述用户与物品之间交互关系矩阵,以物品为列,依次将各用户操作该物品的操作次数除以该物品被进行过的操作总次数来得到与所述用户与物品之间交互关系矩阵对应的概率矩阵,如果该列对应的物品没有被操作过,则概率矩阵该列取满足元素值都相同且和为1的值,并计算所得到的概率矩阵的转置矩阵作为用户相对于物品的概率矩阵;
计算所述物品相对于用户的概率矩阵与所述用户相对于物品的概率矩阵的乘积,得到用户与用户之间的相似度矩阵。
5.根据权利要求4所述的相似性度量方法,其特征在于,
所述物品相对于用户的概率矩阵中概率的概率密度是服从相同方差的正态分布密度,所述用户相对于物品的概率矩阵中概率的概率密度是服从相同方差的正态分布密度。
6.根据权利要求4或5所述的相似性度量方法,其特征在于,
计算所述用户相对于物品的概率矩阵与所述物品相对于用户的概率矩阵的乘积,得到物品与物品之间的相似度矩阵。
7.一种相似性度量系统,其特征在于,包括:
数据收集单元,所述数据收集单元收集用户访问物品的行为并获取用户、物品、以及用户对物品的操作行为的数据;
数学模型建立单元,所述数学模型建立单元对获取的数据进行分析,建立用户与物品之间交互关系矩阵;
概率矩阵生成单元,根据所述用户与物品之间交互关系矩阵,针对每个用户,计算出物品被所述每个用户操作的次数相对于所述物品被所有用户操作的次数的概率,生成与所述用户与物品之间交互关系矩阵对应的物品相对于用户的概率矩阵;并根据所述用户与物品之间交互关系矩阵,针对每个物品,计算出用户操作所述每个物品的次数相对于所述用户操作所有物品的次数的概率,生成与所述用户与物品之间交互关系矩阵对应的用户相对于物品的概率矩阵;
相似度计算单元,所述相似度计算单元计算所述物品相对于用户的概率矩阵与所述用户相对于物品的概率矩阵的乘积,得到用户与用户之间的相似度矩阵。
8.根据权利要求7所述的相似性度量系统,其特征在于,
所述物品相对于用户的概率矩阵中概率的概率密度是服从相同方差的正态分布密度,所述用户相对于物品的概率矩阵中概率的概率密度是服从相同方差的正态分布密度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度移信网络技术(北京)有限公司,未经百度移信网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410244546.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种学者重名的消歧方法及其系统
- 下一篇:一种拣选车