[发明专利]基于信号能量尖峰识别的音频分割方法有效
申请号: | 201911121998.X | 申请日: | 2019-11-15 |
公开(公告)号: | CN110838302B | 公开(公告)日: | 2022-02-11 |
发明(设计)人: | 王旻轩;鲍亭文;金超 | 申请(专利权)人: | 北京天泽智云科技有限公司 |
主分类号: | G10L25/03 | 分类号: | G10L25/03;G10L25/27;G10L25/51 |
代理公司: | 北京煦润律师事务所 11522 | 代理人: | 惠磊 |
地址: | 100191 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 信号 能量 尖峰 识别 音频 分割 方法 | ||
本申请涉及一种基于信号能量尖峰识别的音频分割方法,包括:将输入的音频信号进行短时傅里叶变换,转换为功率谱矩阵;提取基于功率谱的中频能量特征;对提取的中频能量特征进行尖峰识别;对进行尖峰识别后的信号进行错分修正;输出音频信号的分割点时间坐标。本申请的音频分割方法无需设置门限阈值,无需提前训练,能够实时、快速、准确地基于音频信号做出分析,可以部署在边缘端,无需接入其他运行参数,基本实现无参数动态分割。
技术领域
本申请涉及一种基于信号能量尖峰识别的音频分割方法,适用于音频信号处理的技术领域。
背景技术
对于单纯的音频分割算法主要的实现方案有:
1.基于端点检测的分割方法,如申请号为CN200510061358.6的中国专利。利用说话人在讲话间隙出现停顿的特点,检测所有的静音点作为说话人可能发生变化的潜在点。由于在不同的信噪比环境下,静音点很难检测,因而这类方法并不准确。
2.基于模型的分割方法,如申请号为CN201710512310.5、CN201811581291.2的中国专利。首先为不同类型音频段建立相应模型,然后在滑动窗内对输入音频流进行模型最大似然选择,音频分割点被认为是音频类别发生转变的位置。为了建立一般化模型,各类基于模型的分割方法先后被提出并加以实现。如UBM用于区分语音段和非语音段,而UGM则用于区分男、女说话人,然而这些“先验知识”一般不可得。因此该方法对于未知的声学特征没有检测能力。
3.基于距离的分割方法,计算音频流中每个样本点左右窗数据“差异”,由距离尺度表示。当“差异”达到一定程度,也即距离尺度超过某个给定阈值或者取得局部最大值时,则视其为音频分割点。尽管此类方法决策不需要先验知识并且具有较高的分割准确率,然而阈值选择很大程度上依赖于音频特性,因此该方法缺少稳定性和鲁棒性,并且计算量较大。
以风机叶片场景为例,其音频分割的主要实现方案为接入风机叶片的实时转速,运算后得到每支叶片间分割点的大致位置。这种方案简单高效,但是突出问题为:
1.对分割点的定位并不准确,实际的转动过程中是持续变速的,如果按照某一分辨率的时间范围内的平均转速对每支叶片的转动时间进行计算划分,只能大致得到均匀的长度,而实际的转动过程每支叶片所用时间并不一定是等长的。因此这一方法只适用于参考,不适用于作为其他分析算法的准确输入;
2.接入风机叶片实时转速对传感器安装要求较高,高精度转速的获取需要采集设备额外增加传感器硬件,工程实施难度大,成本高,不利于维护,且由于主轴转速采集是在风机的机舱部位,而采集器又布置在塔基,过长的信号传输线路将导致采集信号存在干扰,数据质量差,严重影响分割判读。
发明内容
本申请提供一种基于信号能量尖峰识别的音频分割方法,可以无需设置门限阈值,无需提前训练,能够实时、快速、准确地基于音频信号做出分析,可以部署在边缘端,无需接入其他运行参数,基本实现无参数动态分割。
根据本申请的基于信号能量尖峰识别的音频分割方法,包括以下步骤:
(1)将输入的音频信号进行短时傅里叶变换,转换为功率谱矩阵;
(2)提取基于功率谱的中频能量特征;
(3)对提取的中频能量特征进行尖峰识别;
(4)对进行尖峰识别后的信号进行错分修正;
(5)输出音频信号的分割点时间坐标。
其中,提取能量特征的方法包括以下步骤:
(1)将原始音频信号进行短时傅里叶变换,转换为时频域矩阵M0;
(2)将时频域矩阵M0转为以分贝表示的谱图矩阵M1;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京天泽智云科技有限公司,未经北京天泽智云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911121998.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:性能优化方法、装置及电子设备
- 下一篇:一种数据处理方法、系统及相关设备