[发明专利]一种视频的相关视频列表的生成方法及系统无效
申请号: | 201110446664.7 | 申请日: | 2011-12-27 |
公开(公告)号: | CN103186550A | 公开(公告)日: | 2013-07-03 |
发明(设计)人: | 陈运文;刘作涛;纪达麒;宋海涛 | 申请(专利权)人: | 盛乐信息技术(上海)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;H04N21/258;H04N21/262 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 逯长明;王宝筠 |
地址: | 201203 上海市浦东新区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 相关 列表 生成 方法 系统 | ||
技术领域
本发明涉及相关视频推荐领域,具体而言,涉及一种视频的相关视频列表的生成方法及系统。
背景技术
相关视频推荐系统的概念是:系统通过计算机程序对互联网视频站点的视频进行内容挖掘和语义分析,为每一个视频自动生成一个与该视频内容相关的视频列表。随着互联网内容的不断扩大,视频个数和种类快速增长,用户从大量无关的信息中发现感兴趣的内容越来越困难。相关视频推荐在不需要用户明确指定查询条件的情况下,能够主动给用户展示一些与当前观看内容相关的视频,因而可以让用户更方便的发现内容、提高用户体验、增强网站粘性。
一个视频对应的文本信息通常包括:标题、用户标签、描述、频道分类、发布时间等,这些文本信息中含有大量的跟视频不相关的噪音。为了获得相关的视频列表,需要利用计算机程序,对视频相关的文本提取标签,标签是一种互联网内容组织方式,是相关性很强的关键字,它帮助人们轻松的描述和分类内容,以便于检索和分享。视频的标签分为手动标签和自动标签两种,手动标签是指用户手工输入的标签。自动标签是指根据计算机程序,通过分析视频标题和摘要等,自动生成的标签列表。传统的视频推荐技术中,通过与视频的相同标签的查找或基于视频的分类获得视频的相关视频,在查找范围较大时,使用该方式类似于对需要查找的所有内容进行遍历,导致查找效率低。同时,由于视频网站中视频的数量可以达到千万甚至上亿的数量级别,现有技术中的视频推荐系统无法在超大规模的视频集合中迅速查找出一个候选视频的最相关视频。
针对现有技术中的上述问题,目前尚未提出有效解决方案。
发明内容
本发明提供了一种视频的相关视频列表生成的方法及系统,用以解决现有技术中的视频推荐系统无法在大量视频中迅速查找出视频的相关视频的问题。
根据本发明的一个方面,提供了一种视频的相关视频列表的生成方法,包括:从第一视频的相关文本中生成该视频的多个标签;查找出与所述第一视频的标签对应的倒排索引表,所述倒排索引表中包含与所述第一视频相关的视频的编号;计算所述第一视频与所述倒排索引表中各编号对应的视频的相关度;按照所述相关度由大到小的顺序对所述倒排索引表中各编号对应的视频进行排序;选择排序后的部分或全部视频生成所述第一视频的相关视频列表。
其中,所述第一视频的相关文本至少包括以下一种:所述第一视频的标题、所述第一视频的描述以及所述第一视频的用户标签。
进一步地,所述方法还包括:在查找出与所述第一视频的标签对应的倒排索引表之前,还包括:获取视频库中的视频的标签编号以及视频编号;计算所述视频库中的视频的推荐度;按照所述视频的推荐度由大到小的顺序生成以视频的标签编号为关键字,以所述视频的编号为值的倒排索引表。
其中,所述计算视频库中的视频的推荐度包括:根据以下至少一种参数计算所述视频库中的视频的推荐度:所述视频的点击次数、所述视频的收藏次数、所述视频的清晰度、所述视频的时间以及所述视频的上传时间。
进一步地,所述方法还包括:在计算所述第一视频与所述倒排索引表中各编号对应的视频的相关度之前,还包括:对所述视频库中的视频的标签进行赋权;计算所述第一视频与所述倒排索引表中各编号对应的视频的相关度包括:将所述倒排索引表中的视频的标签的与所述第一视频的标签进行比较;将比较得出的相同的标签的权重相加之和作为所述倒排索引表中的视频与所述第一视频的相关度。
其中,所述对所述视频库中的视频的标签进行赋权包括以下至少一种方式:根据所述视频的标签是否为专有名词、所述视频的标签是否为分类标签、所述视频的标签对应的视频标签的长度、所述视频的标签对应的倒排索引表的长度来对所述视频的标签进行赋权。
根据本发明的另一个方面,提供了一种视频的相关视频列表的生成系统,其特征在于,包括:第一生成模块,用于从第一视频的相关文本中生成该视频的多个标签;查找模块,用于查找出与所述第一视频的标签对应的倒排索引表,所述倒排索引表中包含与所述第一视频相关的视频的编号;第一计算模块,用于计算所述第一视频与所述倒排索引表中各编号对应的视频的相关度;排序模块,用于按照所述相关度由大到小的顺序对所述倒排索引表中各编号对应的视频进行排序;第二生成模块,用于选择排序后的部分或全部视频生成所述第一视频的相关视频列表。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于盛乐信息技术(上海)有限公司,未经盛乐信息技术(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110446664.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于数据补丁包的资料库增量方法
- 下一篇:相机的导光装置