[发明专利]一种基于分层可靠度变化趋势的音频分割方法有效
申请号: | 201610872916.5 | 申请日: | 2016-09-30 |
公开(公告)号: | CN106297824B | 公开(公告)日: | 2017-08-01 |
发明(设计)人: | 杨新宇;王银瑞;丁建行;董怡卓;罗晶;杨泽正;王艺蒙;李雨墨 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G10L25/45 | 分类号: | G10L25/45;G10L25/27;G10L21/0272 |
代理公司: | 西安通大专利代理有限责任公司61200 | 代理人: | 张弘 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 分层 可靠 变化 趋势 音频 分割 方法 | ||
【技术领域】
本发明属于音频信号处理领域,特别涉及一种基于分层可靠度变化趋势的音频分割方法。
【背景技术】
近年来,在信号处理领域中,对信号的分割处理方面,基于内容的音频信号分割,也称跳变点检测,是指利用连续音频信号流在发生转变时听觉特征之间存在差异的现象将音频分为若干片段,每个片段在内容上具有一致性或在声学特征上具有相似性。目前基于内容的音频信号分割方法主要分为基于距离、基于模型、基于模型选择的分割方法3类。其中,基于距离的分割方法是利用相邻窗的样本间的距离来度量相邻音频段的相似性,它具有计算简单的特点,但是该方法在选择候选分割点的时候需要事先设定门限值,并且当门限值较小时,易检测出冗余分割点,而当门限值较大时,会导致分割点漏检,并且对声学特征的改变比较敏感。基于模型的分割方法不需要对阈值的界定,它是使用训练好的模型来分割音频流,但是生成这个模型
需要事先采集样本,反复训练,计算代价过高且适应性差。基于模型选择的方法是一种假设检验的方法,它使用贝叶斯信息准则(Bayesian information criterion,BIC)作为模型的选择标准,具有无门限、鲁棒等优点,但是BIC方法需要不断增加固定窗口长度来计算BIC值,计算量很大,易产生累积误差,根据ΔBIC的正负判断是否为跳变点的硬判决方式具有局限性,并且对于较短的音频分割效果较差。
【发明内容】
为解决现有分割方法中设置门限导致分割点冗余或者漏检,分窗检测方式导致累计误差,硬判决方式存在局限性的问题,本发明提出了一种新的信号音频分割方法——基于分层可靠度变化趋势的音频分割方法。该方法能够有效减少冗余分割点,提高综合性能。
为达以上目的,本发明采用的技术手段如下:
一种基于分层可靠度变化趋势的音频分割方法,包括以下步骤:
1)定长分析窗内基于可靠度变化趋势的分层跳变点检测;
假设每次分析窗内只有一个跳变点,然后计算窗口内各帧的可靠度,根据可靠度的变化趋势来检测分析窗内是否有跳变点;
2)基于定长分析窗内跳变点检测的音频分割;
对整个音频信号特征序列从起始位置加定长分析窗W0,若没有检测到跳变点,窗口向后移动Δl距离,0<Δl<Nmin;继续检测下一区域距离;若检测到跳变点,得到一个定长分析窗内以显著度排序的跳变点的序列;将分析窗W0移至具有最大时间上标的跳变点处,继续检测下一区域;当定长分析窗遍历整个歌曲音频流后,将会得到所有的跳变点的集合CP;然后再将跳变点的集合CP重新按照时间排序,完成对整个音频流的分割。
作为本发明的进一步改进,可靠度的变化趋势是指:
在跳变点xk左侧,随着音频帧靠近跳变点xk时,可靠度值呈上升趋势,在跳变点xk右侧,随着音频帧远离跳变点xk时,可靠度值呈下降趋势,而在跳变点xk处,RE(xk)将取得极大值。
作为本发明的进一步改进,检测分析窗内是否有跳变点具体步骤为:
若未检测到跳变点,表明该窗口中不含跳变点;若检测到跳变点SP1,则以SP1为界,将W0切分为两个子窗W1与W2,然后再按照上述流程检测子窗W1与W2中是否包含跳变点,若未检测到跳变点,则不再切分窗口,认为其中不包含跳变点;若检测到跳变点,则以跳变点为界将子窗一分为二继续检测下一层子窗,直至子窗长度小于最小窗口长度Nmin或子窗内不包含跳变点。
作为本发明的进一步改进,步骤1)具体为:
(i)按帧提取音频特征,确定最大窗口W0的长度为Nmax、最小窗口Wm的长度为Nmin;
(ii)计算分析窗内各帧的可靠度,选取可靠度最大的第k帧作为预选择跳变点,分析窗内始末段NM帧的可靠度不计算,0<NM<Nmin;根据预选择跳变点左右两侧可靠度的变化趋势来确定其是否为真实跳变点,即:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610872916.5/2.html,转载请声明来源钻瓜专利网。