[发明专利]预测时空数据的用户社交联系强度的方法在审
申请号: | 201410851432.3 | 申请日: | 2014-12-31 |
公开(公告)号: | CN104537442A | 公开(公告)日: | 2015-04-22 |
发明(设计)人: | 陈元娟;严建峰;刘晓升;杨璐 | 申请(专利权)人: | 苏州大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/00 |
代理公司: | 苏州市中南伟业知识产权代理事务所(普通合伙) 32257 | 代理人: | 杨明 |
地址: | 215100 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 预测 时空 数据 用户 社交 联系 强度 方法 | ||
技术领域
本发明涉及一种预测时空数据的用户社交联系强度的方法,属于计算机及互联网技术领域。
背景技术
在过去,想要知道一个人的位置信息是通过一些侦查工作来完成的,如紧密的跟随等。随着英特网的迅速发展,其应运而生的空间定位技术也不断成熟,使得人们的位置信息可以毫不费力地获得。位置信息可以从以下几种方式隐式的显现出来,如从人们的移动设备(如基站、GPS或者WiFi热点)和信用卡交易记录来获得。位置信息也可以显式的显现出来,如发表带有地理标签的内容(如博客、在Instagram、Flickr或者Facebook上传照片);通过基于位置的服务网络(如签到)或手机应用程序(如切客,嘀咕等)进行交互。随着时间推移的人们的位置信息(时空数据)是研究各种社会行为的丰富的信息来源。目前,人们通常会通过文本上已有的信息(如签到信息或共现)判断两个人之间的相互关联,但是,这种方式计算较为复杂,且精准度低。
发明内容
为解决上述技术问题,本发明的目的是提供一种操作简单且可提高精准度的预测时空数据的用户社交联系强度的方法。
本发明的一种预测时空数据的用户社交联系强度的方法,包括:
获取时空数据;
将获取的时空数据输入到可以将词表征为实数值向量的单词转换为特征向量的算法中,得到每位用户的特征向量;
将两两用户的特征向量连接,输入到随机森林分类算法中,获得该两两用户的社交联系强度。
进一步的:所述“单词转换为特征向量的算法”为word2vec算法。
进一步的:所述“单词转换为特征向量的算法”为Location-weight算法,所述Location-weight算法为在word2vec算法上结合时空数据中每个位置特异性的算法来产生用户特征向量。
进一步的:在使用Location-weight算法时,给用户数目少的位置赋予一个较大的值,认为该地点是一个私人场所,使其共现的影响对用户的特征向量的较大;给用户数目多的位置赋予一个较小的值,认为该地点是一个公共场所,使其共现的影响对用户的特征向量较小。
进一步的:所述Location-weight算法所用计算公式为:f(x,α)=α(1+e-x)。
进一步的:所述“时空数据”为经处理初步数据所得到的只有用户编号但同样具有时空性的数据。
进一步的:所述“初步数据”中的每条记录依次由用户编号、签到时间、纬度、经度、地点编号组成。
借由上述方案,本发明至少具有以下优点:通过采用将所获取的时空数据输入到可以将词表征为实数值向量的单词转换为特征向量的算法中,得到每位用户的特征向量,从而使得该预测时空数据的用户社交联系强度的方法与现有技术相比,操作更简单,且提高了精准度。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,并可依照说明书的内容予以实施,以下以本发明的较佳实施例并配合附图详细说明如后。
附图说明
图1是本发明预测时空数据的用户社交联系强度的方法的流程图;
图2是本发明的预测时空数据的用户社交联系强度的方法在使用两种算法后的实验效果对比图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
请参见图1,本发明的一种预测时空数据的用户社交联系强度的方法包括步骤S1至步骤S3。
S1:获取时空数据(如表1-2),在本步骤中,所述“时空数据”为经处理初步数据(如表1-1)所得到的只有用户编号但同样具有时空性的数据。
表1-1 初步数据
表1-2 时空数据
上表1-1中的“初步数据”的每条记录依次由用户编号、签到时间、纬度、经度、地点编号组成;上表1-2中的“时空数据”的每条记录标识在同一位置上,根据签到时间排序的用户编号。
S2:将获取的时空数据输入到可以将词表征为实数值向量的单词转换为特征向量的算法中,得到每位用户的特征向量(如表1-3)。
表1-3 用户的特征向量
上述表1-3由用户编号和20维特征向量的值组成;其中每条记录中的第一个数据为用户编号,剩余后面实数是该用户的特征向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学;,未经苏州大学;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410851432.3/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置