[发明专利]一种固定音频检索方法有效
申请号: | 201110028979.X | 申请日: | 2011-01-27 |
公开(公告)号: | CN102622353A | 公开(公告)日: | 2012-08-01 |
发明(设计)人: | 刘赵杰 | 申请(专利权)人: | 天脉聚源(北京)传媒科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100007 北京市东*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 固定 音频 检索 方法 | ||
1.一种固定音频检索方法,其特征在于,包括以下步骤:
A、通过静音段对音频数据进行分段,形成非静音的音频数据检测段;
B、对音频数据检测段进行谐波检测,并对音频数据检测段进行分类,形成音频数据指纹段分类索引;
C、将音频数据检测段分成固定长度的音频数据指纹段,根据信息量对音频数据指纹段进行标识分类,形成音频数据指纹段索引;
D、对每个音频数据指纹段提取音频数据指纹特征,建立音频数据指纹索引;
E、通过静音段对待检索音频数据进行分段,形成非静音的待检索音频数据检测段,从中选取不少于一段时间最长的待检索音频数据检测段作为查询音频数据检测段;
F、对查询音频数据检测段进行谐波检测,确定查询音频数据检测段的类别,通过音频指纹段分类索引,找到查询音频数据检测段对应的音频数据检测段;
G、将查询音频数据检测段分成固定长度的查询音频数据指纹段,逐段评估查询音频数据指纹段的信息量,选取信息量超过预设阈值的最长连续查询音频数据指纹段作为查询音频数据段;
H、在所述的对应的音频数据检测段中,通过音频数据指纹段索引,获得查询音频数据段在所述对应的音频数据检测段中的候选位置;
I、通过音频数据指纹索引,将查询音频数据段与所述对应的音频数据检测段中的候选位置进行匹配,获得音频检索结果。
2.根据权利要求1所述的一种固定音频检索方法,其特征在于,步骤B中,对包含谐波结构的音频数据检测段分成语音段或者音乐段,对不包含谐波结构的音频数据检测段分成噪音段或者无效音段。
3.根据权利要求1所述的一种固定音频检索方法,其特征在于,步骤F中,对包含谐波结构的查询音频数据检测段分成语音段或者音乐段,对不包含谐波结构的查询音频数据检测段分成噪音段或者无效音段。
4.根据权利要求1所述的一种固定音频检索方法,其特征在于,步骤A中,通过音频数据当前段的能量与总体能量的比值,判断是否静音段还是有效声音段。
5.根据权利要求1所述的一种固定音频检索方法,其特征在于,步骤E中,通过待检索音频数据当前段的能量与总体能量的比值,判断是否静音段还是有效声音段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天脉聚源(北京)传媒科技有限公司,未经天脉聚源(北京)传媒科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110028979.X/1.html,转载请声明来源钻瓜专利网。