[发明专利]一种音频文件音质识别方法及其系统有效
申请号: | 201210006916.9 | 申请日: | 2012-01-11 |
公开(公告)号: | CN102568470A | 公开(公告)日: | 2012-07-11 |
发明(设计)人: | 谭健文;谢振宇 | 申请(专利权)人: | 广州酷狗计算机科技有限公司 |
主分类号: | G10L11/02 | 分类号: | G10L11/02;G10L19/02 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 王茹;胡杰 |
地址: | 510665 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音频文件 音质 识别 方法 及其 系统 | ||
技术领域
本发明涉及音频文件质量检测的技术领域,尤其涉及一种音频文件音质识别方法,以及一种音频文件音质识别系统。
背景技术
音质识别技术拥有着广阔的应用领域和前景,目前主要的应用有音频文件质量检测与鉴定,音频压缩、格式转换技术对音频质量损耗的检测与鉴定,录音系统中硬件设备、软件环境的故障检测,音像制品的盗版识别,以及各种乐器、电子拟声设备、播放设备的质量评测。其中,音频文件质量检测与鉴定是目前音质识别技术中最成熟的领域。
音频文件质量检测对于语音声纹声控技术、语音拨号、对多声源环境中的某一音源监听、语音搜索、语音命令起到至关重要的作用。
有音频文件质量检测与鉴定,音频压缩、格式转换技术对音频质量损耗的检测与鉴定,录音系统中硬件设备、软件环境的故障检测,音像制品的盗版识别,以及各种乐器、电子拟声设备、播放设备的质量评测有重要作用。
频谱分析仪依信号处理方式的不同,一般有两种类型;即时频谱分析仪(Real-Time Spectrum Analyzer)与扫描调谐频谱分析仪(Sweep-Tuned Spectrum Analyzer)。即时频率分析仪的功能为在同一瞬间显示频域的信号振幅,其工作原理是针对不同的频率信号而有相对应的滤波器与检知器(Detector),再经由同步的多工扫描器将信号传送到CRT或液晶等显示仪器上进行显示,其优点是能显示周期性杂散波(Periodic Random Waves)的瞬间反应,其缺点是价昂且性能受限于频宽范围,滤波器的数目与最大的多工交换时间(Switching Time)。
最常用的频谱分析仪是扫描调谐频谱分析仪,基本结构类似超外差式接收器,工作原理是输入信号经衰减器直接外加到混波器,可调变的本地振荡器经与CRT同步的扫描产生器产生随时间作线性变化的振荡频率,经混波器与输入信号混波降频后的中频信号(IF)再放大,滤波与检波传送到CRT的垂直方向板,因此在CRT的纵轴显示信号振幅与频率的对应关系。影响信号反应的重要部份为滤波器频宽,滤波器之特性为高斯滤波器,影响的功能就是量测时常见到的解析频宽RBW,代表两个不同频率的信号,能够被清楚的分辨出来的最低频宽差异,两个不同频率的信号频宽如低于频谱分析仪的RBW,此时该两信号将重叠,难以分辨,较低的RBW固然有助于不同频率信号的分辨与量测,低的RBW将滤除较高频率的信号成份,导致信号显示时产生失真,失真值与设定的RBW密切相关,较高的RBW固然有助于宽频带信号的侦测,将增加杂讯底层值(Noise Floor),降低量测灵敏度,对于侦测低强度的信号易产生阻碍,因此适当的RBW宽度是正确使用频谱分析仪重要的概念。
音质识别技术在很长一段时间内采用的是向前-向后双向检测方式,这种技术手段有两个非常明显的缺陷:
1.计算量的浪费:由于计算方法落后,导致计算时间过长,对硬件资源和能源的消耗较大。
2.计算路径不能明确判定:因为识别技术采用向前-向后的双线计算方式,导致计算路径单一,对于某些音域识别的准确性有影响。
发明内容
本发明要解决的技术问题在于提供一种能够快速准确地判断音频文件质量的音频文件音质识别方法。
一种音频文件音质识别方法,包括:将音频文件以预定的时间间隔平均划分为多个音频片段;将各个所述音频片段转换到频域;根据各个所述音频片段的频域对应的能量值,计算所述音频文件的平均截断频率;比较所述音频文件的平均截断频率与基准截断频率;当所述音频文件的平均截断频率大于所述基准截断频率时,将所述音频文件划分为高音质音频文件,否则,将所述音频文件划分为低音质音频文件。
本发明要解决的技术问题还在于提供一种能够快速准确地判断音频文件质量的音频文件音质识别系统。
一种音频文件音质识别系统,包括:音频分段模块、转换模块、截断频率计算模块、比较模块、分类模块。所述音频分段模块用于将音频文件以预定的时间间隔平均划分为多个音频片段;所述转换模块用于将各个所述音频片段转换到频域;所述截断频率计算模块用于根据各个所述音频片段的频域对应的能量值,计算所述音频文件的平均截断频率;所述比较模块用于比较所述音频文件的平均截断频率与基准截断频率;所述分类模块用于在所述音频文件的平均截断频率大于所述基准截断频率时,将所述音频文件划分为高音质音频文件;在所述音频文件的平均截断频率不大于所述基准截断频率时,否则,将所述音频文件划分为低音质音频文件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州酷狗计算机科技有限公司,未经广州酷狗计算机科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210006916.9/2.html,转载请声明来源钻瓜专利网。