[发明专利]一种面向事件的微博搜索方法有效
申请号: | 201610325193.7 | 申请日: | 2016-05-17 |
公开(公告)号: | CN106021450B | 公开(公告)日: | 2019-06-18 |
发明(设计)人: | 赵峰;朱亚军;王沛;金海 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 曹葆青 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种面向事件的微博搜索方法,包括微博的索引策略和对最后搜索结果的排名。微博索引策略是指对满足什么条件的微博进行搜因和怎样对这些微博进行索引,索引策略直接影响索引和查询的效率。本发明采用部分索引策略,只对和事件相关的微博进行索引,仅仅对包含主题标签或者命名实体的微博进行索引;索引结构则是采用的是简单的单倒排索引。对搜索结果的排名是指对搜索结果按照一定的策略进行排名,从而将最符合用户需求的结果呈现给用户。本发明的排名机制将用户的重要性和微博本身的特性进行线性组合:用户的重要性是考虑到微博中用户的关注的数量和被关注的数量,微博本身的特性则涉及到某条微博的被转发次数和评论次数。 | ||
搜索关键词: | 一种 面向 事件 搜索 方法 | ||
【主权项】:
1.一种面向事件的微博搜索方法,其特征在于,包括以下步骤:(1)对原始的微博数据集进行预处理:除去微博中的噪音,利用词袋模型将微博中的单词转化存储,以方便索引;(2)对微博按照部分索引的策略进行单倒排索引,并将不相关的微博写入到日志文件;(3)用户输入关键字,搜索和关键字相关的微博,并等待搜索方法返回结果;(4)系统接受关键字并在索引结构中查找和关键字相关的微博,并保存查询到的微博;(5)对查询到的微博按照排名函数进行打分,将每条微博按照打分的降序进行排名,将搜索结果返回给用户;所述步骤(2)包括以下子步骤:(2‑1)判断该条微博中是否包含主题标签或者命名实体;(2‑2)如果该条微博中包含主题标签或者命名实体则表明该微博与事件相关,将其加入到单倒排索引中去,否则将其加入到日志文件中去;(2‑3)周期性检测微博加入到索引中的时间,如果某条微博加入到索引的时间超过15天,则将该条微博从索引结构中去掉,然后将其加入到日志文件中去。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610325193.7/,转载请声明来源钻瓜专利网。
- 上一篇:一种美白粉底霜
- 下一篇:用于分析和合成复杂知识表示的系统和方法