[发明专利]一种联合优化深层变换特征与聚类过程的声场景聚类方法有效
申请号: | 201910033838.3 | 申请日: | 2019-01-15 |
公开(公告)号: | CN109859771B | 公开(公告)日: | 2021-03-30 |
发明(设计)人: | 李艳雄;刘名乐;王武城;张聿晗 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G10L25/24 | 分类号: | G10L25/24;G10L25/30;G10L25/45;G10L25/51 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 李斌 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种联合优化深层变换特征与聚类过程的声场景聚类方法,步骤如下:a、提取各样本的对数梅尔谱特征并作为一个初始类,初始化一个卷积神经网络;b、将各样本的对数梅尔谱特征输入卷积神经网络,提取深层变换特征;c、采用凝聚分层聚类算法合并最相似的两个类,得到新的类标签及样本并用于更新卷积神经网络,类数减一,再采用更新后的卷积神经网络将各样本的对数梅尔谱特征变换为深层变换特征;d、如果当前类数等于真实类数,则停止聚类,得到联合优化的声场景聚类结果和卷积神经网络,否则跳到第c步。本方法的深层变换特征提取与聚类交替进行,得到联合优化结果,与传统聚类方法相比性能更优;与传统分类方法相比更具普适性。 | ||
搜索关键词: | 一种 联合 优化 深层 变换 特征 过程 声场 景聚类 方法 | ||
【主权项】:
1.一种联合优化深层变换特征与聚类过程的声场景聚类方法,其特征在于,所述的声场景聚类方法包括如下步骤:S1、提取对数梅尔谱特征:对各类声场景的样本进行预加重、分帧、加窗,然后分别提取每一音频帧的对数梅尔谱特征;S2、初始化各类及卷积神经网络:将每个样本作为一个初始类,初始化生成一个卷积神经网络用于提取深层变换特征;S3、更新卷积神经网络,提取新的深层变换特征:根据类标签及各类样本更新卷积神经网络参数,并用更新后的卷积神经网络提取各类样本的深层变换特征;S4、合并最相似的两个类:采用凝聚分层聚类算法将相似度最大的两个类合并在一起,得到新的类标签和各类样本,类数减一;S5、聚类收敛判决:如果当前类数等于真实类数,则停止聚类,得到联合优化的声场景聚类结果和卷积神经网络,否则跳到步骤S3。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910033838.3/,转载请声明来源钻瓜专利网。