[发明专利]LBSN中基于好友聚类的社交搜索评价方法有效
申请号: | 201710335698.6 | 申请日: | 2017-05-12 |
公开(公告)号: | CN107194560B | 公开(公告)日: | 2020-11-27 |
发明(设计)人: | 曹玖新;孙洋;周丹丹 | 申请(专利权)人: | 东南大学 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q50/00;G06F16/35 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 杜静静 |
地址: | 211189 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了LBSN中一种基于好友聚类的社交搜索评价方法。从Foursquare真实数据集中提取基于位置信息和联系人信息等多维特征,提出基于好友聚类的KNN搜索算法,设计基于倒排索引的搜索引擎,结合距离等因素使搜索结果更加精确、搜索速度得到提升。为使搜索结果更加精确,首先,在研究用户好友的基础上,对好友进行聚类。由于LBSN属于异构网络,数据集比较稀疏,通过聚类可以使数据更加稠密,消除奇异点,降低因数据稀疏导致的不利影响;其次,搜索算法的设计上,在考虑了传统社交影响力的基础上,增加了专业相关度和距离远近两个指标,即综合搜索得分、社交得分和距离得分。最后,综合三个指标构建并训练线性规划模型得到搜索结果,使得搜索结果是用户满意的。 | ||
搜索关键词: | lbsn 基于 好友 社交 搜索 评价 方法 | ||
【主权项】:
一种LBSN中基于好友聚类的社交搜索评价方法,其特征在于,所述评价方法包括以下步骤,1)爬取的Foursquare真实数据集中有联系人信息和位置信息,通过对数据的统计与分析,提取出联系人特征、签到特征、评价特征和时间特征,共15种数据类型,包括用户ID、好友ID、签到ID、签到位置描述、签到发生时区、签到位置ID、签到位置经纬度、签到位置名称、签到位置的类型ID、签到位置的类型名称、签到发生时间、评价文本ID、评价文本内容、评价发生时间,构建社交搜索模型并给出形式化描述,筛选发生在纽约的数据集,这种方法同样适用于其他城市;2)从步骤1)处理好的数据集中提取位置名称、位置类型、位置描述三种数据类型,构建“位置名称‑文档”式倒排索引,在此基础上,基于Lucene技术构建社交搜索引擎;3)线上部分设计搜索算法,在基于搜索得分的位置排序部分,搜索用户输入搜索内容,经语义分词产生话题,与步骤2)倒排索引中的文档进行相似度匹配,根据专业相关性得分索引出备选位置和基于得分的位置排序;4)在搜索算法中基于社交得分的位置排序部分,从步骤1)处理好的数据集中提取联系人数据、签到数据和评价数据,线下通过K‑Means算法聚类搜索用户的好友,通过KNN算法查找搜索用户一定数量的最近邻,线上通过这些最近邻对搜索用户施加社交影响,通过设计最近邻的区域活跃度和对位置的评价两个社交特征计算步骤3)中的备选位置的社交得分并排序;5)在搜索算法中基于距离远近的位置排序部分,从步骤1)处理好的数据集中提取位置经纬度数据,通过地球上两点间的距离公式,计算搜索用户当前位置和步骤3)中备选位置的各自距离,量化成得分并排序;6)综合步骤3)、步骤4)、步骤5)中的三种位置排序,构建线性回归模型并训练,得出最终的位置排序,即搜索结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710335698.6/,转载请声明来源钻瓜专利网。
- 上一篇:电磁组合直线振动式混合颗粒分选装置
- 下一篇:履带移动式水平筛分站
- 同类专利
- 专利分类
G06 计算;推算;计数
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理