[发明专利]LBSN中基于好友聚类的社交搜索评价方法有效

专利信息
申请号: 201710335698.6 申请日: 2017-05-12
公开(公告)号: CN107194560B 公开(公告)日: 2020-11-27
发明(设计)人: 曹玖新;孙洋;周丹丹 申请(专利权)人: 东南大学
主分类号: G06Q10/06 分类号: G06Q10/06;G06Q50/00;G06F16/35
代理公司: 南京众联专利代理有限公司 32206 代理人: 杜静静
地址: 211189 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了LBSN中一种基于好友聚类的社交搜索评价方法。从Foursquare真实数据集中提取基于位置信息和联系人信息等多维特征,提出基于好友聚类的KNN搜索算法,设计基于倒排索引的搜索引擎,结合距离等因素使搜索结果更加精确、搜索速度得到提升。为使搜索结果更加精确,首先,在研究用户好友的基础上,对好友进行聚类。由于LBSN属于异构网络,数据集比较稀疏,通过聚类可以使数据更加稠密,消除奇异点,降低因数据稀疏导致的不利影响;其次,搜索算法的设计上,在考虑了传统社交影响力的基础上,增加了专业相关度和距离远近两个指标,即综合搜索得分、社交得分和距离得分。最后,综合三个指标构建并训练线性规划模型得到搜索结果,使得搜索结果是用户满意的。
搜索关键词: lbsn 基于 好友 社交 搜索 评价 方法
【主权项】:
一种LBSN中基于好友聚类的社交搜索评价方法,其特征在于,所述评价方法包括以下步骤,1)爬取的Foursquare真实数据集中有联系人信息和位置信息,通过对数据的统计与分析,提取出联系人特征、签到特征、评价特征和时间特征,共15种数据类型,包括用户ID、好友ID、签到ID、签到位置描述、签到发生时区、签到位置ID、签到位置经纬度、签到位置名称、签到位置的类型ID、签到位置的类型名称、签到发生时间、评价文本ID、评价文本内容、评价发生时间,构建社交搜索模型并给出形式化描述,筛选发生在纽约的数据集,这种方法同样适用于其他城市;2)从步骤1)处理好的数据集中提取位置名称、位置类型、位置描述三种数据类型,构建“位置名称‑文档”式倒排索引,在此基础上,基于Lucene技术构建社交搜索引擎;3)线上部分设计搜索算法,在基于搜索得分的位置排序部分,搜索用户输入搜索内容,经语义分词产生话题,与步骤2)倒排索引中的文档进行相似度匹配,根据专业相关性得分索引出备选位置和基于得分的位置排序;4)在搜索算法中基于社交得分的位置排序部分,从步骤1)处理好的数据集中提取联系人数据、签到数据和评价数据,线下通过K‑Means算法聚类搜索用户的好友,通过KNN算法查找搜索用户一定数量的最近邻,线上通过这些最近邻对搜索用户施加社交影响,通过设计最近邻的区域活跃度和对位置的评价两个社交特征计算步骤3)中的备选位置的社交得分并排序;5)在搜索算法中基于距离远近的位置排序部分,从步骤1)处理好的数据集中提取位置经纬度数据,通过地球上两点间的距离公式,计算搜索用户当前位置和步骤3)中备选位置的各自距离,量化成得分并排序;6)综合步骤3)、步骤4)、步骤5)中的三种位置排序,构建线性回归模型并训练,得出最终的位置排序,即搜索结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201710335698.6/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top