[发明专利]一种基于分层可靠度变化趋势的音频分割方法有效
申请号: | 201610872916.5 | 申请日: | 2016-09-30 |
公开(公告)号: | CN106297824B | 公开(公告)日: | 2017-08-01 |
发明(设计)人: | 杨新宇;王银瑞;丁建行;董怡卓;罗晶;杨泽正;王艺蒙;李雨墨 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G10L25/45 | 分类号: | G10L25/45;G10L25/27;G10L21/0272 |
代理公司: | 西安通大专利代理有限责任公司61200 | 代理人: | 张弘 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 分层 可靠 变化 趋势 音频 分割 方法 | ||
1.一种基于分层可靠度变化趋势的音频分割方法,其特征在于,包括以下步骤:
1)定长分析窗内基于可靠度变化趋势的分层跳变点检测;
定义:xk的可靠度RE(xk)为左右两段信号在各自模型上的似然对数之和,假设每次分析窗内只有一个跳变点,然后计算窗口内各帧的可靠度,根据可靠度的变化趋势来检测分析窗内是否有跳变点;
2)基于定长分析窗内跳变点检测的音频分割;
对整个音频信号特征序列从起始位置加定长分析窗W0,若没有检测到跳变点,窗口向后移动Δl距离,0<Δl<Nmin,Nmin为最小窗口Wm的长度;继续检测下一区域距离;若检测到跳变点,得到一个定长分析窗内以显著度排序的跳变点的序列;将分析窗W0移至具有最大时间上标的跳变点处,继续检测下一区域;当定长分析窗遍历整个歌曲音频流后,将会得到所有的跳变点的集合CP;然后再将跳变点的集合CP重新按照时间排序,完成对整个音频流的分割。
2.根据权利要求1所述的一种基于分层可靠度变化趋势的音频分割方法,其特征在于,可靠度的变化趋势是指:
在跳变点xk左侧,随着音频帧靠近跳变点xk时,可靠度值呈上升趋势,在跳变点xk右侧,随着音频帧远离跳变点xk时,可靠度值呈下降趋势,而在跳变点xk处,RE(xk)将取得极大值。
3.根据权利要求1所述的一种基于分层可靠度变化趋势的音频分割方法,其特征在于,检测分析窗内是否有跳变点具体步骤为:
若未检测到跳变点,表明该窗口中不含跳变点;若检测到跳变点SP1,则以SP1为界,将W0切分为两个子窗W1与W2,然后再按照上述流程检测子窗W1与W2中是否包含跳变点,若未检测到跳变点,则不再切分窗口,认为其中不包含跳变点;若检测到跳变点,则以跳变点为界将子窗一分为二继续检测下一层子窗,直至子窗长度小于最小窗口长度Nmin或子窗内不包含跳变点。
4.根据权利要求1所述的一种基于分层可靠度变化趋势的音频分割方法,其特征在于,步骤1)具体为:
(i)按帧提取音频特征,确定最大窗口W0的长度为Nmax、最小窗口Wm的长度为Nmin;
(ii)计算分析窗内各帧的可靠度,选取可靠度最大的第k帧作为预选择跳变点,分析窗内始末段NM帧的可靠度不计算,0<NM<Nmin;根据预选择跳变点左右两侧可靠度的变化趋势来确定其是否为真实跳变点,即:
其中,IncNumL(k)是第k帧左侧可靠度上升的次数,NumL是第k帧左侧的帧数,SumIncREL(k)是第k帧左侧可靠度的增加量,SumDecREL(k)是第k帧左侧可靠度的减少量,DecNumR(k)是第k帧右侧可靠度下降的次数,NumR是第k帧右侧的帧数,SumIncRER(k)是第k帧右侧可靠度的增加量,SumDecRER(k)是第k帧右侧可靠度的减少量,α是音频帧数百分比;
(iii)若(2)不成立,则窗内不包含跳变点;
(iv)若(2)成立,则预选择跳变点第k帧为真实跳变点,并将跳变点放入跳变点集合,然后以跳变点为界,将窗口一分为二分割成两个子窗;判断子窗是否长度小于最小窗口长度,小于最小窗口长度的不予处理,大于最小窗口长度的子窗执行(ii)步骤,若(2)不成立,不再切分窗口;若(2)成立,跳到(iv)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610872916.5/1.html,转载请声明来源钻瓜专利网。