[发明专利]一种用于实时监控的音频聚类方法有效
申请号: | 201811484229.1 | 申请日: | 2018-12-06 |
公开(公告)号: | CN109783683B | 公开(公告)日: | 2022-11-18 |
发明(设计)人: | 贺前华;吴志敏 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F16/65 | 分类号: | G06F16/65;G06K9/62 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 何淑珍;黄海波 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种用于实时监控的音频聚类方法,包括步骤:(1)音频数据预处理分段:利用基频值特点把基频值不同的时间上相邻的两个音频段分离开;(2)基于特征点对齐的分段快速计算音频距离:对计算的音频样本的N阶特征点进行基于相似性度量的对齐后分段计算样本距离,快速得到两段音频的距离;(3)利用连通距离提高聚类的类内纯净度:对于每段音频,通过连通距离设定距离阈值来剔除噪点以提高类内纯净度,完成聚类。本发明通过切割细分增加了音频样本的事件独立性,通过快速对齐进行分段DTW计算降低时间复杂度同时增加对齐精确度,在聚类过程中控制每一类的类内纯净度,以便后续模型建立中提高训练样本的纯净度,提高模型的描述能力。 | ||
搜索关键词: | 一种 用于 实时 监控 音频 方法 | ||
【主权项】:
1.一种用于实时监控的音频聚类方法,包括以下步骤:(1)音频数据预处理分段:利用基频值特点把基频值不同的时间上相邻的两个音频段分离开;(2)基于特征点对齐的分段快速计算音频距离:对计算的音频样本的N阶特征点进行基于相似性度量的对齐后分段计算样本距离,快速得到两段音频的距离;(3)利用连通距离提高聚类的类内纯净度:对于每段音频,通过连通距离设定距离阈值来剔除噪点以提高类内纯净度,完成聚类。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811484229.1/,转载请声明来源钻瓜专利网。