[发明专利]一种基于视频标题和内容的视频过滤方法和系统有效

专利信息
申请号: 201310631404.6 申请日: 2013-12-02
公开(公告)号: CN103678527B 公开(公告)日: 2017-10-24
发明(设计)人: 刘世才;毛海涛;宋轲 申请(专利权)人: TCL集团股份有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 深圳市君胜知识产权代理事务所(普通合伙)44268 代理人: 王永文,刘文求
地址: 516001 广东省惠州市*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于视频标题和内容的视频过滤方法和系统,通过对视频的标题进行拆词,计算标题的相似度和比较视频流的相似度。并将标题的相似度和视频流的相似度作为组合条件进行视频过滤,达到视频去重的效果。从而可以对相似度高的视频新闻进行有效过滤,最大限度的去掉一些类似的视频新闻,让用户在有限时间内观看到的新闻都是当日的头条新闻,为用户带来更好的体验。
搜索关键词: 一种 基于 视频 标题 内容 过滤 方法 系统
【主权项】:
一种基于视频标题和内容的视频过滤方法,其特征在于,包括:获取两则视频;比较两则视频的视频标题是否一样,若是则过滤掉其中一则视频,否则对两则视频的视频标题进行拆词处理;所述拆词的方法为:使用开源项目Lucene的词库进行拆词,并按照正向拆分法对所述视频标题进行切分,再采用对拆分后的各个词匹配计数的方式来衡量文字匹配相同的程度,从而得到拆词后的视频标题的匹配度;判断拆词后的视频标题的匹配度是否超过预先设定的匹配度阈值,若是则过滤掉其中一则视频,否则比较两则视频的视频内容是否一致,若一致则过滤掉其中一则视频;比较两则视频的视频内容是否一致具体包括:A、根据两则视频的播放地址,分别获取与所述播放地址对应的视频信息文件,并从所述视频信息文件里面获取两则视频的视频地址;B、根据两则视频的视频地址,下载并获取二进制的数据流内容,并对数据流内容进行比较;C、若两个二进制的数据流内容一致,则确定两则视频的视频内容一致,否则为不同的视频内容;比较两则视频流内容指的是比较两则视频的相同播放位置的二进制码流数据;所述过滤掉其中一则视频步骤中,包括:进一步比较两则视频的属性值,根据所述属性值确定过滤掉哪一则视频;其中,所述视频的属性值包括:视频的连接速度和视频的清晰度;每一属性值具有不同的权重,且权重由用户自行设定,通过比较视频属性值,确保保留下的视频是最佳的,当所有属性相同的时候,随机过滤掉一条视频。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于TCL集团股份有限公司,未经TCL集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201310631404.6/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top