[发明专利]多媒体文件的片头和/或片尾的识别方法及装置有效
申请号: | 201410148996.0 | 申请日: | 2014-04-14 |
公开(公告)号: | CN103974145B | 公开(公告)日: | 2017-11-07 |
发明(设计)人: | 由清圳 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | H04N21/845 | 分类号: | H04N21/845;H04N21/84;G06K9/00 |
代理公司: | 北京鸿德海业知识产权代理事务所(普通合伙)11412 | 代理人: | 袁媛 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多媒体 文件 片头 片尾 识别 方法 装置 | ||
【技术领域】
本发明涉及多媒体技术,尤其涉及一种多媒体文件的片头和/或片尾的识别方法及装置。
【背景技术】
多媒体文件例如,视频文件一般可以包括片头和/或片尾,对片头和/或片尾进行有效的识别,能够为多媒体文件的处理带来更多益处。例如,播放多媒体文件时,可以跳过片头和/或片尾等。现有技术中,操作人员可以逐一对多媒体文件进行人工识别,以识别该多媒体文件的片头和/或片尾。
然而,现有的片头和/或片尾的识别操作复杂,且容易出错,从而导致了片头和/或片尾识别的效率和可靠性的降低。
【发明内容】
本发明的多个方面提供一种多媒体文件的片头和/或片尾的识别方法及装置,用以提高片头和/或片尾识别的效率和可靠性。
本发明的一方面,提供一种多媒体文件的片头和/或片尾的识别方法,包括:
获取待处理的多媒体文件,所述多媒体文件包括至少两帧图像;
利用对象跟踪技术,对所述至少两帧图像进行识别处理,以获得目标文件片段;
根据所述多媒体文件的字幕内容和字幕时间,获得目标字幕片段;
根据所述目标文件片段和所述目标字幕片段,确定所述多媒体文件的片头和/或片尾。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述利用对象跟踪技术,对所述至少两帧图像进行识别处理,以获得目标文件片段,包括:
利用对象跟踪技术,提取所述至少两帧图像中出现目标对象的图像,以获得至少两个候选文件片段;
根据所述至少两个候选文件片段中相邻的候选文件片段之间的第一时间间隔和预先设置的第一时间阈值,对相邻的候选文件片段进行合并处理,以获得所述目标文件片段。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据所述多媒体文件的字幕内容和字幕时间,获得目标字幕片段,包括:
根据所述多媒体文件的字幕内容和字幕时间,获得至少两个候选字幕片段;
根据所述至少两个候选字幕片段中相邻的候选字幕片段之间的第二时间间隔和预先设置的第二时间阈值,对相邻的候选字幕片段进行合并处理,以获得所述目标字幕片段。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述对象跟踪技术包括人脸跟踪技术。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述根据所述目标文件片段和所述目标字幕片段,确定所述多媒体文件的片头和/或片尾,包括:
根据所述目标文件片段和所述目标字幕片段,获得至少一个融合文件片段;
根据所述至少一个融合文件片段的开始时间、所述至少一个融合文件片段的结束时间、所述至少一个融合文件片段中相邻的融合文件片段之间的第三时间间隔和预先设置的第三时间阈值,确定所述多媒体文件的片头和/或片尾。
本发明的另一方面,提供一种多媒体文件的片头和/或片尾的识别装置,包括:
获取单元,用于获取待处理的多媒体文件,所述多媒体文件包括至少两帧图像;
文件处理单元,用于利用对象跟踪技术,对所述至少两帧图像进行识别处理,以获得目标文件片段;
字幕处理单元,用于根据所述多媒体文件的字幕内容和字幕时间,获得目标字幕片段;
决策单元,用于根据所述目标文件片段和所述目标字幕片段,确定所述多媒体文件的片头和/或片尾。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述文件处理单元,具体用于
利用对象跟踪技术,提取所述至少两帧图像中出现目标对象的图像,以获得至少两个候选文件片段;以及
根据所述至少两个候选文件片段中相邻的候选文件片段之间的第一时间间隔和预先设置的第一时间阈值,对相邻的候选文件片段进行合并处理,以获得所述目标文件片段。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述字幕处理单元,具体用于
根据所述多媒体文件的字幕内容和字幕时间,获得至少两个候选字幕片段;以及
根据所述至少两个候选字幕片段中相邻的候选字幕片段之间的第二时间间隔和预先设置的第二时间阈值,对相邻的候选字幕片段进行合并处理,以获得所述目标字幕片段。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述对象跟踪技术包括人脸跟踪技术。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述决策单元,具体用于
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410148996.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种进气管总成
- 下一篇:一种用于汽车的动力提升装置