[发明专利]一种音频特征检测的方法有效
申请号: | 201310589888.2 | 申请日: | 2013-11-20 |
公开(公告)号: | CN103632682B | 公开(公告)日: | 2019-11-15 |
发明(设计)人: | 严亚路;吴维昊;史峰 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G10L25/78 | 分类号: | G10L25/78 |
代理公司: | 11201 北京清亦华知识产权代理事务所(普通合伙) | 代理人: | 张大威<国际申请>=<国际公布>=<进入 |
地址: | 230088安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音频 特征 检测 方法 | ||
本发明提供一种音频特征检测的方法,主要实现了以下功能:A、对音频提取包络,实现音量过大、过小、截幅检测功能;B、比对音频断音处前后能量值,实现断音检测功能;C、对音频首尾处的音量值进行一阶直线拟合处理,获取拟合后直线的斜率和垂直偏移,实现首尾淡入淡出效果的检测功能;D、典型的电流声语谱图上存在明显的亮直线特征,通过计算音频能量以及对应方差值,分析出这一特性,实现电流声检测的功能。本发明优点在于采用了提取包络的方法,进一步提升音量检测的准确性;能够很好的完成淡入淡出的检测,准确性较高;本方法对特定的电流声具有很好的检测效果。
技术领域
本发明属于音频处理领域,尤其涉及一种用于音频特征检测的方法,其为对音频音量异常、断音、淡入淡出、电流声的检测方法。
背景技术
随着现代人生活素质的不断提高,人们对音乐品质的追求也越来越迫切。高品质MP3、无损格式音乐以及诸如此类的音乐欣赏网站和软件也越来越多的介入到人们的日常生活之中。但是,在海量的音乐曲库中,音频的质量好坏层次不齐,采用人工对音质进行检测需要耗费巨大的工作量,不具有可持续性。因此,这就需要一个很好的措施来解决这个问题。
发明内容
本发明的目的在于提供一种音频特征检测的方法,这些特征会在一定程度上影响听众的听觉效果,从而给人工检测音质好坏提供一定的参考。通过这个方法,可以自动化检测音频特征,降低人工检测所耗费的巨大工作量和人力风险,有效提升检测的效率。同时还可以减少人为因素导致的特征误检率,进一步保证了检测的准确性。
本发明采用的技术方案为:一种音频特征检测方法,该方法包括了如下步骤:
1)音量异常检测
音量异常主要是由声音过大、过小以及静音导致,规定好音量过小、过大、静音的上下限,对音频提取包络,计算每个包络的平均音量大小,并统计分析结果,实现音量异常检测功能;
2)截幅检测
截幅主要是因为声音过大并超过了采样值所能表示的最大值范围导致,通过计算每一帧内音频的采样值,判断是否存在多个点以上的采样值越界问题, 实现截幅检测功能;
3)断音检测
断音主要是由于外界原因,使原始音频的连续性遭到破坏,听感上存在明显的不连贯,通过比对音频断音处前后能量值,实现断音检测功能;
4)淡入淡出检测
淡入淡出是人为在音频首尾所添加的一种效果,使声音有个过渡的作用,对音频首尾处的音量值进行一阶直线拟合处理,获取拟合后直线的斜率和垂直偏移,实现首尾淡入淡出效果的检测功能;
5)电流声检测
电流声是元器件中的电子的不规则热运动造成的很微弱的电信号被放大后的“声音”,一般主要由于环境、音频传输所导致,典型的电流声语谱图上存在明显的亮直线特征,通过计算音频能量以及对应方差值,分析出这一特性,实现电流声检测的功能。
本发明的原理在于:
A、对音频提取包络,实现音量过大、过小、截幅检测功能;
B、比对音频断音处前后能量值,实现断音检测功能;
C、对音频首尾处的音量值进行一阶直线拟合处理,获取拟合后直线的斜率和垂直偏移,实现首尾淡入淡出效果的检测功能;
D、典型的电流声语谱图上存在明显的亮直线特征,通过计算音频能量以及对应方差值,分析出这一特性,实现电流声检测的功能。
本发明与现有技术相比的优点在于:
(1)、音量异常检测:采用了提取包络的方法,进一步提升检测的准确性;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310589888.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:表皮细胞的动态富集方法
- 下一篇:一种防治慢性腹泻的药物