[发明专利]一种混合音视频检索方法及系统在审
申请号: | 201410668366.6 | 申请日: | 2014-11-21 |
公开(公告)号: | CN104391924A | 公开(公告)日: | 2015-03-04 |
发明(设计)人: | 马展;田海 | 申请(专利权)人: | 南京讯思雅信息科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 朱小兵 |
地址: | 211100 江苏省南京市江宁*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种混合音视频检索方法及系统,方法包括:步骤(1)将任意视频数据分解成视频序列和音频序列;步骤(2)针对视频序列,通过场景分析提取有限场景帧;步骤(3)在有限场景帧上提取特征点组成表征该场景帧的特征矢量;步骤(4)针对音频序列,通过使用音频转文字的算法,将其转换成和音频时间轴匹配的文字串;步骤(5)根据音视频同步时间轴信息将步骤(3)所述场景帧的特征矢量和步骤(4)所述文字串匹配,作为元数据附加在原始视频数据头文件,开放给上层接口检索。本发明提出一种混合音视频检索系统。本发明通过综合视频特征提取,音频转文字,文字关键字自动传递,将海量视频数据检索效率和准确性大大提高。 | ||
搜索关键词: | 一种 混合 视频 检索 方法 系统 | ||
【主权项】:
一种混合音视频检索方法,其特征在于,包括以下步骤:步骤(1)、将任意视频数据分解成视频序列和音频序列;所述视频序列和音频序列中均包含音视频同步时间轴信息;步骤(2)、针对视频序列,通过场景分析提取有限场景帧;步骤(3)、在有限场景帧上提取特征点组成表征该场景帧的特征矢量;步骤(4)、针对音频序列,通过使用音频转文字的算法,将其转换成和音频时间轴匹配的文字串;步骤(5)、根据音视频同步时间轴信息将步骤(3)所述场景帧的特征矢量和步骤(4)所述文字串匹配,作为元数据附加在原始视频数据头文件,开放给上层接口检索。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京讯思雅信息科技有限公司,未经南京讯思雅信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410668366.6/,转载请声明来源钻瓜专利网。