[发明专利]一种用于实时监控的音频聚类方法有效

申请号：	201811484229.1	申请日：	2018-12-06
公开（公告）号：	CN109783683B	公开（公告）日：	2022-11-18
发明（设计）人：	贺前华;吴志敏	申请（专利权）人：	华南理工大学
主分类号：	G06F16/65	分类号：	G06F16/65;G06K9/62
代理公司：	广州粤高专利商标代理有限公司 44102	代理人：	何淑珍;黄海波
地址：	510640 广***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种用于实时监控的音频聚类方法，包括步骤：(1)音频数据预处理分段：利用基频值特点把基频值不同的时间上相邻的两个音频段分离开；(2)基于特征点对齐的分段快速计算音频距离：对计算的音频样本的N阶特征点进行基于相似性度量的对齐后分段计算样本距离，快速得到两段音频的距离；(3)利用连通距离提高聚类的类内纯净度：对于每段音频，通过连通距离设定距离阈值来剔除噪点以提高类内纯净度，完成聚类。本发明通过切割细分增加了音频样本的事件独立性，通过快速对齐进行分段DTW计算降低时间复杂度同时增加对齐精确度，在聚类过程中控制每一类的类内纯净度，以便后续模型建立中提高训练样本的纯净度，提高模型的描述能力。
搜索关键词：	一种用于实时监控音频方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种用于实时监控的音频聚类方法，包括以下步骤：(1)音频数据预处理分段：利用基频值特点把基频值不同的时间上相邻的两个音频段分离开；(2)基于特征点对齐的分段快速计算音频距离：对计算的音频样本的N阶特征点进行基于相似性度量的对齐后分段计算样本距离，快速得到两段音频的距离；(3)利用连通距离提高聚类的类内纯净度：对于每段音频，通过连通距离设定距离阈值来剔除噪点以提高类内纯净度，完成聚类。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于华南理工大学，未经华南理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201811484229.1/，转载请声明来源钻瓜专利网。

上一篇：一种基于点对相似度的深度非松弛哈希图像检索方法
下一篇：一种视频的情感识别方法、装置、设备及可读存储介质

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种用于实时监控的音频聚类方法有效

专利文献下载