[发明专利]一种社交网络中用户属性的预测方法及系统有效
申请号: | 201410005723.0 | 申请日: | 2014-01-06 |
公开(公告)号: | CN103745105B | 公开(公告)日: | 2017-05-03 |
发明(设计)人: | 程学旗;贾岩涛;王元卓;张泽慧;冯凯 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/00 |
代理公司: | 北京泛华伟业知识产权代理有限公司11280 | 代理人: | 王勇 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 社交 网络 用户 属性 预测 方法 系统 | ||
技术领域
本发明涉及预测社交网络中用户属性的技术,尤其涉及一种社交网络中用户地理位置的预测方法及系统。
背景技术
社交网络,又称社交网络服务(Social Networking Service,简称SNS),其主要作用是为一群拥有相同兴趣与活动的人创建在线社区。这类服务往往是基于互联网,为用户提供各种联系和交流的交互通路,如电子邮件、实时消息服务等。多数社交网络会提供多种让用户交互起来的方式,包括聊天、寄信、影音、文件分享、博客、讨论组群等,社交网络为信息的交流与分享提供了新的途径。社交网络的网站一般拥有数百万的登记用户,使用社交网络服务已成为用户每天生活不可或缺的一部分。
在社交网络(例如Twitter,Facebook和Gollwala等)中预测用户的属性,在近年来受到很大关注。这是因为预测用户的属性很有意义,以用户的地理位置为例,预测用户的地理位置对基于地理位置的推送服务很有帮助,如疾病预防和控制、个人账户安全,以及人口统计分析等等。目前,如果每个用户公开他们的属性,通常可以基于用户好友的影响力以及好友的属性来预测该用户在未来某个时间的属性。本文中,属性指那些在外界因素的影响下可动态变化的属性,如用户位置、兴趣、情感、观点和行为(如在线购物,投票)等。对于地理位置属性,现有技术通常是基于用户在移动行为上的相似性来定义用户影响力的,但其均没有考虑到好友影响力会随时间发生变化,这导致最终预测的用户位置准确性较低。
发明内容
为解决现有预测技术中存在的问题,根据本发明的一个实施例,提供一种社交网络中用户属性的预测方法,所述方法包括:
步骤1)、统计一段时间内每个时刻对用户影响力最大的N个好友,其中N为正整数;
步骤2)、根据每个时刻对用户影响力最大的N个好友在每个时刻的属性来预测将来时刻所述用户的属性。
在一个实施例中,步骤1)包括:
步骤11)、对于一段时间内的每个时刻,通过计算好友对所述用户在所述属性的一个或多个方面的影响力,得到该好友对所述用户在该时刻的影响力;
步骤12)、选择每个时刻对用户影响力最大的N个好友。
在进一步的实施例中,在步骤11)中,利用下式得到好友v对所述用户u在ti时刻的影响力:
其中,表示好友v对所述用户u在ti时刻的影响力;m为针对所述属性考虑的方面个数;表示在ti时刻,好友v对所述用户u在所述属性的第j个方面的影响力;wj表示所述属性的第j个方面的权重。
在进一步的实施例中,根据以下步骤获得所述属性的第j个方面的权重wj:
步骤A)、初始化权重向量w为任意的m元组,其中m是针对所述属性考虑的方面个数;
步骤B)、计算ti时刻好友对所述用户的影响力;
步骤C)、根据ti时刻好友对所述用户的影响力计算随机游走转移概率矩阵其中,α为重新启动概率,其使得随机游走具有α概率跳回用户v并在ti时刻重启动;
步骤D)、计算重启动的随机游走在ti时刻的固定分布其满足:
步骤E)、根据下式更新权重向量w:
其中,λ是可选步长;且
其中,g(p)=1/(1+e-p),h(x)=max{x,0}2,是ti时刻用户u的非好友集,是ti时刻用户u的好友集合,δld为和的差值。
步骤F)、如果更新后的w与更新前的w的差值小于预定阈值,则得到最终的权重向量,否则返回步骤B)。
在一个实施例中,在步骤2)中,根据下式得到在将来时刻所述用户的属性:
其中,x1:T是在将来一段时间1至T内每个时刻所预测的所述用户的属性的随机变量序列,y1:T是在一段时间1至T内每个时刻观测到的所述用户影响力最大的N个好友的属性的随机变量。
在一个实施例中,所述属性为地理位置,且在步骤11)中,好友对所述用户在所述属性的一个或多个方面的影响力包括下列的一个或多个:
好友对所述用户的动态影响力,该动态影响力是由所述用户距离自己家的距离和所述用户距离好友家的距离确定的;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410005723.0/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理