[发明专利]基于微博平台的扩展关键词获取方法和设备有效
申请号: | 201110410180.7 | 申请日: | 2011-12-09 |
公开(公告)号: | CN103164415A | 公开(公告)日: | 2013-06-19 |
发明(设计)人: | 张波;孟遥;于浩 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 朱胜;陈炜 |
地址: | 日本神*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 平台 扩展 关键词 获取 方法 设备 | ||
1.一种基于微博平台的扩展关键词获取方法,包括:
条目获取步骤,以输入的关键词在微博平台进行搜索,以获取与所输入的关键词相关联的多个条目;
微博条目图构建步骤,以所获取的多个条目作为微博条目图的节点、以各节点之间的关系作为所述微博条目图的边,计算所述微博条目图的各节点的权重和各条边的权重,从而构建与所输入的关键词相关的微博条目图;
关键词袋提取步骤,从所获取的多个条目提取关键词袋;以及
关键词扩展图构建步骤,以所输入的关键词和所提取的关键词袋中的各个关键词作为关键词扩展图的节点、以所输入的关键词与所述各个关键词之间的关系作为所述关键词扩展图的边,计算所述关键词扩展图的各节点的权重和各条边的权重,从而构建与所输入的关键词相关的关键词扩展图。
2.根据权利要求1所述的方法,其中,所述微博条目图构建步骤进一步包括:第一边权重计算子步骤,基于所述微博条目图的边的类型、作者的粉丝数目以及所述微博条目图的各节点的文本长度,计算所述微博条目图的各条边的权重。
3.根据权利要求1所述的方法,其中,所述微博条目图构建步骤进一步包括:第一节点权重计算子步骤,基于算出的所述微博条目图的各条边的权重以及各节点的出度,利用个性化排序技术计算所述微博条目图的各节点的权重。
4.根据权利要求1所述的方法,其中,所述关键词扩展图构建步骤进一步包括:第二边权重计算子步骤,基于所输入的关键词与所提取的关键词袋中的各个关键词之间的支持度和置信度,计算所述关键词扩展图的各条边的权重。
5.根据权利要求1所述的方法,其中,所述关键词扩展图构建步骤进一步包括:第二节点权重计算子步骤,基于所述微博条目图中包括某一关键词的节点的权重,计算关键词扩展图中该关键词节点的权重。
6.一种基于微博平台的扩展关键词获取设备,包括:
条目获取模块,被配置成以输入的关键词在微博平台进行搜索,以获取与所输入的关键词相关联的多个条目;
微博条目图构建模块,被配置成以所获取的多个条目作为微博条目图的节点、以各节点之间的关系作为所述微博条目图的边,计算所述微博条目图的各节点的权重和各条边的权重,从而构建与所输入的关键词相关的微博条目图;
关键词袋提取模块,被配置成从所获取的多个条目提取关键词袋;以及
关键词扩展图构建模块,被配置成以所输入的关键词和所提取的关键词袋中的各个关键词作为关键词扩展图的节点、以所输入的关键词与所述各个关键词之间的关系作为所述关键词扩展图的边,计算所述关键词扩展图的各节点的权重和各条边的权重,从而构建与所输入的关键词相关的关键词扩展图。
7.根据权利要求6所述的设备,其中,所述微博条目图构建模块进一步包括:第一边权重计算子模块,被配置成基于所述微博条目图的边的类型、作者的粉丝数目以及所述微博条目图的各节点的文本长度,计算所述微博条目图的各条边的权重。
8.根据权利要求6所述的设备,其中,所述微博条目图构建模块进一步包括:第一节点权重计算子模块,被配置成基于算出的所述微博条目图的各条边的权重以及各节点的出度,利用个性化排序技术计算所述微博条目图的各节点的权重。
9.根据权利要求6所述的设备,其中,所述关键词扩展图构建包括进一步包括:第二边权重计算子模块,被配置成基于所输入的关键词与所提取的关键词袋中的各个关键词之间的支持度和置信度,计算所述关键词扩展图的各条边的权重。
10.根据权利要求6所述的设备,其中,所述关键词扩展图构建包括进一步包括:第二节点权重计算子模块,被配置成基于所述微博条目图中包括某一关键词的节点的权重,计算关键词扩展图中该关键词节点的权重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110410180.7/1.html,转载请声明来源钻瓜专利网。