[发明专利]一种基于用户话题权威性的微博重排序方法有效
申请号: | 201410564145.4 | 申请日: | 2014-10-21 |
公开(公告)号: | CN104317881B | 公开(公告)日: | 2017-11-24 |
发明(设计)人: | 礼欣;李懿;翟艳梅 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京理工正阳知识产权代理事务所(普通合伙)11639 | 代理人: | 唐华 |
地址: | 100081 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 用户 话题 权威性 微博重 排序 方法 | ||
技术领域
本发明涉及一种微博排序方法,特别涉及一种基于用户话题权威性的微博重排序方法,属于微博搜索技术领域。
背景技术
随着计算机技术的不断发展以及人民生活水平的不断提高,互联网越来越普及,网络资源极大丰富,这给网页搜索以及微博搜索技术提出了极大挑战。对于网页搜索,现有的比较有代表性的搜索引擎比如谷歌、百度,运用一定的策略搜集互联网上的信息,然后使用一定的方法根据用户查询关键字将检索到的信息展现给用户,而微博搜索引擎和传统的网页搜索引擎相似,区别在于检索的信息以及实用的排序机制不同。
现有的技术中,微博搜索引擎所采用的主流技术是:当用户以关键词搜索微博时,搜索引擎会在数据库中进行查询,如果找到与该用户输入内容相符的微博,便采用一定的策略,比如说,根据该条微博被转发的次数、发表该微博的用户的权威值,以及该条微博与其他微博的内容相似度等特征,计算出每一条微博的对应值,并以此值为基础对搜索出来的微博进行排序,将得到的微博排序结果返回给用户。
但是,上述微博搜索引擎采用的主流排序技术中,在考虑用户权威这个特征时,只是考虑的用户的比较一般化的特征,比如说,使用用户的粉丝数、用户的粉丝数与其关注的人的数量比、用户的微博被转发次数等来代表用户的权威值,并没有考虑用户在特定话题上的权威性,这些传统的衡量用户权威值的方法存在一定的弊端,因为它们这样做会使用户在所有话题上的权威值相同,而直观来讲,一个用户很有可能只对一个或几个领域精通,对其他的领域则不甚了解。
发明内容
本发明的目的是在微博搜索领域提供一种用户话题权威性的计算方法以及一种基于用户话题权威性值的微博重排序方法,从而证明用户话题权威性值在微博搜索排序中的重要性。该方法能够根据用户输入的搜索关键词,在搜索引擎返回的按时间排序的结果集中,计算结果集中的每一个用户的话题权威值,并按照话题权威值对返回的微博进行重新排序,以此来提高返回结果的质量。
本发明技术方案的思想是通过获取用户搜索关键词信息,将用户搜索关键词划分到某个话题,然后对微博搜索引擎按照时间顺序返回来的近几天最新结果,再在该话题上对所有的用户计算话题权威值(表征该用户的话题权威性),根据此话题权威值,再一次对搜索引擎返回的搜索结果进行重排序。
本发明的具体实现步骤如下:
一种用户话题权威性的计算方法,该方法包括以下步骤:
步骤一、获取话题以及由微博搜索引擎返回的按照时间排序的结果集;
步骤二、在步骤一得到的结果集中抽取所有用户id;
步骤三、获取步骤二中每一个用户id一跳网络中的信息;
步骤四、从步骤三得到的结果集中提取步骤一获取的话题上的所有微博及其对应的用户信息;
步骤五、从步骤四得到的结果集中提取话题度量;
步骤六、提出用户话题权威性的特征、特征计算公式并计算;
步骤七、提出用户话题权威性即话题权威值计算公式并计算;
步骤八、返回用户话题权威值计算结果。
一种基于用户话题权威性的微博重排序方法,该方法包括以下步骤:
步骤一、按照用户话题权威值从大到小顺序对用户排序;
步骤二、根据用户的排名顺序对搜索引擎返回的按照时间顺序排列的微博进行重新排序;对于一个用户多条微博的情况,微博按照时间先后排序;
步骤三、将重新排序的微博结果返回给用户。
有益效果
本发明针对微博搜索领域,综合考虑用户话题权威性以及传统的话题权威度量,提出用户话题权威值的计算方法,并使用得到的用户话题权威值对搜索引擎按照时间顺序返回的结果进行调整,其意义在于,该方法能够提高排序后返回结果的质量,从而证明用户话题权威性在微博排序中的有效性,增强用户体验。
附图说明
图1为本发明实施例中微博用户权威值计算流程图;
图2为本发明实施例中微博重排序的流程图;
图3为本发明实施例中特征ID、GF1、MI、TS以及NS的密度函数图;
图4为本发明实施例中特征ID、GF1、MI、TS以及NS为高斯分布的QQ图;
图5为本发明实施例中特征TS以及NS分别为对数正态分布(Lognormal)以及混合高斯分布(GMM)时的QQ图;
图6(a)(b)(c)分别为本发明实施例中,以“google”数据集上特征ID、TS以及NS的密度函数拟合图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410564145.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种理气开郁茉莉茶及其制作方法
- 下一篇:一种苦瓜片荷叶舒缓茶及其制备方法