[发明专利]一种基于微博热门话题的视频聚合方法及系统有效
申请号: | 201310566249.4 | 申请日: | 2013-11-14 |
公开(公告)号: | CN103577593B | 公开(公告)日: | 2017-07-07 |
发明(设计)人: | 脱立恒;严灏;江佳伟;刘学 | 申请(专利权)人: | 中国科学院声学研究所;上海尚恩华科网络科技股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京亿腾知识产权代理事务所11309 | 代理人: | 陈霁 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 热门话题 视频 聚合 方法 系统 | ||
1.一种基于微博热门话题的视频聚合方法,其特征在于,该方法包括以下步骤:
从互联网抓取视频元数据并保存在数据库中;
根据所述视频元数据形成视频特征词库,并从各大微博平台抓取最新微博,针对每条微博提取出多个特征词代表该条微博,根据所述视频特征词库计算出该条微博的视频特征权值,筛选出视频特征权值超过设定阈值的微博,并对这些微博进行分类,提取热门话题;
根据所述热门话题及视频元数据对视频进行匹配筛选;
将筛选出的视频进行排列聚合,并呈现;
所述根据所述视频元数据形成视频特征词库步骤包括:
从所述数据库中获取视频描述信息,所述的视频描述信息包括视频元数据;
根据各视频描述信息计算各视频描述中各特征词的文本特征权值,提取各视频描述中特征权值最大的多个特征词及权值,组成视频特征词库。
2.根据权利要求1所述的方法,其特征在于,所述根据所述热门话题及视频元数据对视频进行匹配筛选步骤包括:
选出包含微博数量最多的若干个聚类,每个聚类为一个热门话题;
计算所述数据库中各视频元数据与各个热门话题聚类的相似度,每个热门话题选择若干个相似度超过一定阈值的视频。
3.根据权利要求1所述的方法,其特征在于:所述将筛选出的视频进行排列聚合,并呈现的步骤包括:
将筛选出的视频按相似度进行排列聚合,并呈现在视频聚合门户上。
4.一种基于微博热门话题的视频聚合系统,其特征在于,该系统包括内容采集模块、热点分析模块、视频聚合模块、内容服务模块和视频聚合门户:
所述内容采集模块从互联网抓取视频元数据并保存在数据库中;
所述热点分析模块根据所述视频元数据形成视频特征词库,并从各大微博平台抓取最新微博,针对每条微博提取出多个特征词代表该条微博,根据所述视频特征词库计算出该条微博的视频特征权值,筛选出视频特征权值超过设定阈值的微博,并对这些微博进行聚类,提取热门话题;
所述视频聚合模块根据所述热门话题及视频元数据对视频进行匹配筛选;
所述内容服务模块将上述视频聚合模块筛选出的视频进行排列聚合,并呈现在视频聚合门户上;
所述内容采集模块具体用于:
从所述数据库中获取视频描述信息,所述的视频描述信息包括视频元数据;
根据各视频描述信息计算各视频描述中各特征词的文本特征权值,提取各视频描述中特征权值最大的多个特征词及权值,组成视频特征词库。
5.根据权利要求4所述的系统,其特征在于,所述热点分析模块具体用于:
选出包含微博数量最多的若干个聚类,每个聚类为一个热门话题;
计算所述数据库中各视频元数据与各个热门话题聚类的相似度,每个热门话题选择若干相似度超过一定阈值的视频。
6.根据权利要求4所述的系统,其特征在于:所述内容服务模块具体用于:
将筛选出的视频按相似度进行排列聚合,并呈现在视频聚合门户上。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所;上海尚恩华科网络科技股份有限公司,未经中国科学院声学研究所;上海尚恩华科网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310566249.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种波导缝隙阵列天线校正装置及校正方法
- 下一篇:一种标记文件解析方法和装置