[发明专利]LBSN中基于好友聚类的社交搜索评价方法有效
申请号: | 201710335698.6 | 申请日: | 2017-05-12 |
公开(公告)号: | CN107194560B | 公开(公告)日: | 2020-11-27 |
发明(设计)人: | 曹玖新;孙洋;周丹丹 | 申请(专利权)人: | 东南大学 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q50/00;G06F16/35 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 杜静静 |
地址: | 211189 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | lbsn 基于 好友 社交 搜索 评价 方法 | ||
本发明公开了LBSN中一种基于好友聚类的社交搜索评价方法。从Foursquare真实数据集中提取基于位置信息和联系人信息等多维特征,提出基于好友聚类的KNN搜索算法,设计基于倒排索引的搜索引擎,结合距离等因素使搜索结果更加精确、搜索速度得到提升。为使搜索结果更加精确,首先,在研究用户好友的基础上,对好友进行聚类。由于LBSN属于异构网络,数据集比较稀疏,通过聚类可以使数据更加稠密,消除奇异点,降低因数据稀疏导致的不利影响;其次,搜索算法的设计上,在考虑了传统社交影响力的基础上,增加了专业相关度和距离远近两个指标,即综合搜索得分、社交得分和距离得分。最后,综合三个指标构建并训练线性规划模型得到搜索结果,使得搜索结果是用户满意的。
技术领域
本发明涉及一种评价方法,具体涉及一种LBSN中基于好友聚类的社交搜索评价方法,属于社交搜索技术领域。
背景技术
在线社交网络(OSNs)的发展给人们的日常生活带来了极大的便利,如今每天有多达数十亿的用户活跃在OSNs上,产生了大量的社交信息。渐渐地,人们更喜欢通过OSNs搜索信息而不是传统的搜索引擎,社交搜索便应运而生。由于传统搜索方式有查准率低,用户筛选时间长,搜索结果一致化等缺点,在用户个性化搜索的背景下,社交搜索依托于传统的搜索原理,结合用户的社交信息,可以产生个性化的搜索结果,提高搜索精度。特别是基于位置的社交网络(LBSNs)的出现,在移动电话等移动设备和GPS、WiFi等移动技术的支持下,为社交搜索的移动化研究提供了重要的研究平台。
LBSN平台上对社交搜索的研究成果很少,对社交搜索的研究主要在两方面:设计搜索引擎和改进搜索算法。虽然现有研究都在充分挖掘LBSNs提供的联系人信息和位置信息,不过依然有很多不足之处。有的研究更注重搜索速度的提升,通过改进索引结构提高搜索速度,忽视了数据集的稀疏问题,进而影响了搜索精度;有的研究分析位置点上发生的具体事件,比如地震,火灾等,实现对特定位置点发生的事件的搜索,但缺少搜索对象领域的广泛化,领域比较单一,不能较好满足现实需求;有的研究由于评价方法如相似度度量标准主观且社交搜索系统的负载过大,导致搜索效果仍有提高的空间。
发明内容
本发明正是针对现有技术中存在的技术问题,提供一种LBSN中基于好友聚类的社交搜索评价方法,该技术方案在于通过设计基于位置信息和联系人信息等多维特征,提出基于好友聚类的KNN搜索算法,设计基于倒排索引的搜索引擎,结合距离等因素使搜索结果更加精确、搜索速度得到提升。其中,搜索算法综合考虑了三种排序得分:搜索得分即基于专业相关性的位置排序、社交得分即基于社交影响力的位置排序、空间得分即基于距离远近的位置排序。
为了实现上述目的,本发明的技术方案如下,一种LBSN中基于好友聚类的社交搜索评价方法,其特征在于,所述评价方法包括以下步骤,1)爬取的Foursquare真实数据集中有联系人信息和位置信息,通过对数据的统计与分析,提取出联系人特征、签到特征、评价特征和时间特征,共15种数据类型,包括用户ID、好友ID、签到ID、签到位置描述、签到发生时区、签到位置ID、签到位置经纬度、签到位置名称、签到位置的类型ID、签到位置的类型名称、签到发生时间、评价文本ID、评价文本内容、评价发生时间,构建社交搜索模型并给出形式化描述,筛选发生在纽约的数据集,这种方法同样适用于其他城市;
2)从步骤1)处理好的数据集中提取位置名称、位置类型、位置描述三种数据类型,构建“位置名称-文档”式倒排索引,在此基础上,基于Lucene技术构建社交搜索引擎;
3)线上部分设计搜索算法,在基于搜索得分的位置排序部分,搜索用户输入搜索内容,经语义分词产生话题,与步骤2倒排索引中的文档进行相似度匹配,根据专业相关性得分索引出备选位置和基于得分的位置排序;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710335698.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电磁组合直线振动式混合颗粒分选装置
- 下一篇:履带移动式水平筛分站
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理