[发明专利]一种基于视频标题和内容的视频过滤方法和系统有效
申请号: | 201310631404.6 | 申请日: | 2013-12-02 |
公开(公告)号: | CN103678527B | 公开(公告)日: | 2017-10-24 |
发明(设计)人: | 刘世才;毛海涛;宋轲 | 申请(专利权)人: | TCL集团股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 深圳市君胜知识产权代理事务所(普通合伙)44268 | 代理人: | 王永文,刘文求 |
地址: | 516001 广东省惠州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于视频标题和内容的视频过滤方法和系统,通过对视频的标题进行拆词,计算标题的相似度和比较视频流的相似度。并将标题的相似度和视频流的相似度作为组合条件进行视频过滤,达到视频去重的效果。从而可以对相似度高的视频新闻进行有效过滤,最大限度的去掉一些类似的视频新闻,让用户在有限时间内观看到的新闻都是当日的头条新闻,为用户带来更好的体验。 | ||
搜索关键词: | 一种 基于 视频 标题 内容 过滤 方法 系统 | ||
【主权项】:
一种基于视频标题和内容的视频过滤方法,其特征在于,包括:获取两则视频;比较两则视频的视频标题是否一样,若是则过滤掉其中一则视频,否则对两则视频的视频标题进行拆词处理;所述拆词的方法为:使用开源项目Lucene的词库进行拆词,并按照正向拆分法对所述视频标题进行切分,再采用对拆分后的各个词匹配计数的方式来衡量文字匹配相同的程度,从而得到拆词后的视频标题的匹配度;判断拆词后的视频标题的匹配度是否超过预先设定的匹配度阈值,若是则过滤掉其中一则视频,否则比较两则视频的视频内容是否一致,若一致则过滤掉其中一则视频;比较两则视频的视频内容是否一致具体包括:A、根据两则视频的播放地址,分别获取与所述播放地址对应的视频信息文件,并从所述视频信息文件里面获取两则视频的视频地址;B、根据两则视频的视频地址,下载并获取二进制的数据流内容,并对数据流内容进行比较;C、若两个二进制的数据流内容一致,则确定两则视频的视频内容一致,否则为不同的视频内容;比较两则视频流内容指的是比较两则视频的相同播放位置的二进制码流数据;所述过滤掉其中一则视频步骤中,包括:进一步比较两则视频的属性值,根据所述属性值确定过滤掉哪一则视频;其中,所述视频的属性值包括:视频的连接速度和视频的清晰度;每一属性值具有不同的权重,且权重由用户自行设定,通过比较视频属性值,确保保留下的视频是最佳的,当所有属性相同的时候,随机过滤掉一条视频。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于TCL集团股份有限公司,未经TCL集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310631404.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种胸腹腔引流管固定支架
- 下一篇:制氧车
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法