[发明专利]一种联合优化深层变换特征与聚类过程的声场景聚类方法有效
申请号: | 201910033838.3 | 申请日: | 2019-01-15 |
公开(公告)号: | CN109859771B | 公开(公告)日: | 2021-03-30 |
发明(设计)人: | 李艳雄;刘名乐;王武城;张聿晗 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G10L25/24 | 分类号: | G10L25/24;G10L25/30;G10L25/45;G10L25/51 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 李斌 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 联合 优化 深层 变换 特征 过程 声场 景聚类 方法 | ||
本发明公开了一种联合优化深层变换特征与聚类过程的声场景聚类方法,步骤如下:a、提取各样本的对数梅尔谱特征并作为一个初始类,初始化一个卷积神经网络;b、将各样本的对数梅尔谱特征输入卷积神经网络,提取深层变换特征;c、采用凝聚分层聚类算法合并最相似的两个类,得到新的类标签及样本并用于更新卷积神经网络,类数减一,再采用更新后的卷积神经网络将各样本的对数梅尔谱特征变换为深层变换特征;d、如果当前类数等于真实类数,则停止聚类,得到联合优化的声场景聚类结果和卷积神经网络,否则跳到第c步。本方法的深层变换特征提取与聚类交替进行,得到联合优化结果,与传统聚类方法相比性能更优;与传统分类方法相比更具普适性。
技术领域
本发明涉及音频信号处理与模式识别技术领域,特别涉及一种联合优 化深层变换特征与聚类过程的声场景聚类方法。
背景技术
声场景聚类(Acoustic scene clustering,ASC)是对采集到的各类声场景 音频样本进行相似度比较,将相同类别的音频样本合并在一起。声场景聚 类的目的主要是让机器更加智能化,使其拥有类似于人类分辨周围声学环 境的能力,从而能够为人类提供更智能化的服务。声场景聚类技术是音频 监控、自动辅助驾驶、多媒体内容分析与检索等应用领域的重要基础,具 有重要的研究价值与实际意义。
传统的监督声场景分类方法需要对每个音频训练样本进行人工标注 以便训练分类器,但人工标注成本昂贵、主观性强、效率低。目前各类声 场景的音频数据爆炸式增长,很多样本都没有标签,因此有监督的声场景 聚类方法在实际应用时有一定的局限性。目前无监督的声场景分类方法一 般将音频特征提取与声场景聚类分开进行,不能得到最优的声场景聚类结 果。因此,如何联合优化特征提取与声场景聚类过程以便得到较优的聚类结果,是进一步提高声场景聚类性能的关键,也是海量音频数据被充分挖 掘利用的重要手段之一。目前亟待提出一种联合优化深层变换特征与聚类 过程的声场景聚类方法,有效克服了目前方法的不足。
发明内容
本发明的目的是为了解决现有技术中的上述缺陷,提供一种联合优化 深层变换特征与聚类过程的声场景聚类方法。
本发明的目的可以通过采取如下技术方案达到:
一种联合优化深层变换特征与聚类过程的声场景聚类方法,所述的声 场景聚类方法包括如下步骤:
S1、提取对数梅尔谱特征:对各类声场景的样本进行预加重、分帧、 加窗,然后分别提取每一音频帧的对数梅尔谱特征;
S2、初始化各类及卷积神经网络:将每个样本作为一个初始类,初始 化生成一个卷积神经网络用于提取深层变换特征;
S3、更新卷积神经网络,提取新的深层变换特征:根据类标签及各类 样本更新卷积神经网络参数,并用更新后的卷积神经网络提取各类样本的 深层变换特征;
S4、合并最相似的两个类:采用凝聚分层聚类算法将相似度最大的两 个类合并在一起,得到新的类标签和各类样本,类数减一;
S5、聚类收敛判决:如果当前类数等于真实类数,则停止聚类,得到 联合优化的声场景聚类结果和卷积神经网络,否则跳到步骤S3。
进一步地,所述的步骤S1中提取对数梅尔谱特征具体包括以下步骤:
S1.1、音频数据采集与标注:在不同的场景采集音频数据流,然后将 每一个音频数据流分割成一定长度的音频段,三人或三人以上对音频段进 行人工标注,对于存在异议的音频段标注,按照少数服从多数的原则确定 最终的标签;
S1.2、预加重:设置数字滤波器的传递函数为H(z)=1-αz-1,其中α为 一个系数且取值为:0.9≤α≤1,读入的音频段通过该数字滤波器后实现预 加重;
S1.3、分帧、加窗:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910033838.3/2.html,转载请声明来源钻瓜专利网。