[发明专利]一种基于微博热门话题的视频聚合方法及系统有效

专利信息
申请号: 201310566249.4 申请日: 2013-11-14
公开(公告)号: CN103577593B 公开(公告)日: 2017-07-07
发明(设计)人: 脱立恒;严灏;江佳伟;刘学 申请(专利权)人: 中国科学院声学研究所;上海尚恩华科网络科技股份有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京亿腾知识产权代理事务所11309 代理人: 陈霁
地址: 100190 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 热门话题 视频 聚合 方法 系统
【说明书】:

技术领域

发明涉及互联网视频聚合领域,特别涉及一种基于微博热门话题的视频聚合方法及系统。

背景技术

近年来网络视频数量呈爆炸性的增长,各视频网站之间的竞争越加激烈,视频聚合门户随之诞生。视频聚合门户能将用户所喜爱的分布在不同视频网站的视频聚合起来,使得用户可以进行一站式观看。但是现有的视频聚合门户推荐给用户的热点视频多基于自身网站数据中的用户观看评论数量,热点视频推荐不够准确,无法吸引用户;同时需要等待用户观看信息的反馈,推荐不具时效性;而且此种热点话题均只有单个视频,用户选择余地太小。

微博是近几年兴起的基于用户关系信息分享、传播以及获取平台,在广大网络用户尤其是年轻的网络用户中非常流行。很多微博用户都会第一时间将自己所关心的事物和话题在微博上进行分享,故此其内容非常具有时效性。因而,微博的热点话题可以很好的作为当前网络热门话题动态的一个代表。故我们对一定数量的实时微博进行分析,以取得当前的微博热门话题来代表当前的网络热门话题。根据网络热门话题来聚合视频,用户可以获得更新更热门的视频。但是经过实际测试发现,先从微薄分析热点,再搜索视频时,分析得到的一些热点并没有相关的热点,无法进行视频聚合。

发明内容

本发明的目的在于,为用户提供与网络最新热点相关的一系列视频,热点具有针对性,视频聚合门户呈现的视频更具时效性及吸引力,同时使得用户能更加全面的了解所关注的热点。

为实现上述目的,一方面,本发明提供了一种基于微博热门话题的视频聚合方法,该方法包括以下步骤:

从互联网抓取视频元数据并保存在数据库中;根据视频元数据形成视频特征词库,并从各大微博平台抓取最新微博,针对每条微博提取出多个特征词代表该条微博,根据视频特征词库计算出该条微博的视频特征权值,筛选出视频特征权值超过设定阈值的微博,并对这些微博进行聚类,提取热门话题;根据所述热门话题及视频元数据对视频进行匹配筛选;将筛选出的视频进行排列聚合,并呈现。

另一方面,本发明提供了一种基于微博热门话题的视频聚合系统,该系统包括内容采集模块、热点分析模块、视频聚合模块、内容服务模块和视频聚合门户:

内容采集模块用于从互联网抓取视频元数据,并保存在数据库中;

热点分析模块根据视频元数据形成视频特征词库,并从各大微博平台抓取最新微博,针对每条微博提取出多个特征词代表该条微博,根据视频特征词库计算出该条微博的视频特征权值,筛选出视频特征权值超过设定阈值的微博,并对这些微博进行聚类,提取热门话题;

视频聚合模块根据热门话题及视频元数据对视频进行匹配筛选;

内容服务模块将视频聚合模块筛选出的视频进行排列聚合,并呈现在视频聚合门户上。

本发明的优点在于:首先,视频门户上聚合呈现的视频相对现有视频门户呈现的热点视频更具时效性,微博平台的特点使得当前的大量微博总能代表当前的最新热门话题,通过微博提取出热点词对视频进行聚合呈现,更具时效性。其次,视频聚合的主题更具针对性,根据视频特征词库筛选后得到的微博基本都与现有视频资源相关,聚类得到的热门话题不会超出现有视频资源的范围,聚合主题更具针对性

附图说明

图1为本发明实施例提供的一种基于微博热门话题的视频聚合系统架构示意图;

图2为图1所示系统中热点分析模块提取热门话题的方法流程图。

具体实施方式

下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。

图1为本发明实施例提供的一种基于微博热门话题的视频聚合系统架构示意图。如图1所示,该系统包括:内容采集模块11、热点分析模块12、视频聚合模块13、内容服务模块14和视频聚合门户15。

内容采集模块11用于从互联网抓取视频元数据并保存在数据库中;

热点分析模块12用于根据内容采集模块11抓取的视频元数据形成视频特征词库,并从各大微博平台抓取最新微博,针对每条微博提取出多个特征词代表该条微博,根据视频特征词库计算出该条微博的视频特征权值,筛选出视频特征权值超过设定阈值的微博,并对这些微博进行聚类,提取热门话题;

视频聚合模块13根据所述热门话题及视频元数据对视频进行匹配筛选;

内容服务模块14将视频聚合模块筛选出的视频进行排列聚合,并呈现在视频聚合门户15上。

如图1所示,该系统的执行步骤包括步骤101-105:

在步骤101,内容采集模块11采集视频元数据,交由热点分析模块12形成视频特征词库。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所;上海尚恩华科网络科技股份有限公司,未经中国科学院声学研究所;上海尚恩华科网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310566249.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top