[发明专利]一种用于实时监控的音频聚类方法有效

专利信息
申请号: 201811484229.1 申请日: 2018-12-06
公开(公告)号: CN109783683B 公开(公告)日: 2022-11-18
发明(设计)人: 贺前华;吴志敏 申请(专利权)人: 华南理工大学
主分类号: G06F16/65 分类号: G06F16/65;G06K9/62
代理公司: 广州粤高专利商标代理有限公司 44102 代理人: 何淑珍;黄海波
地址: 510640 广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种用于实时监控的音频聚类方法,包括步骤:(1)音频数据预处理分段:利用基频值特点把基频值不同的时间上相邻的两个音频段分离开;(2)基于特征点对齐的分段快速计算音频距离:对计算的音频样本的N阶特征点进行基于相似性度量的对齐后分段计算样本距离,快速得到两段音频的距离;(3)利用连通距离提高聚类的类内纯净度:对于每段音频,通过连通距离设定距离阈值来剔除噪点以提高类内纯净度,完成聚类。本发明通过切割细分增加了音频样本的事件独立性,通过快速对齐进行分段DTW计算降低时间复杂度同时增加对齐精确度,在聚类过程中控制每一类的类内纯净度,以便后续模型建立中提高训练样本的纯净度,提高模型的描述能力。
搜索关键词: 一种 用于 实时 监控 音频 方法
【主权项】:
1.一种用于实时监控的音频聚类方法,包括以下步骤:(1)音频数据预处理分段:利用基频值特点把基频值不同的时间上相邻的两个音频段分离开;(2)基于特征点对齐的分段快速计算音频距离:对计算的音频样本的N阶特征点进行基于相似性度量的对齐后分段计算样本距离,快速得到两段音频的距离;(3)利用连通距离提高聚类的类内纯净度:对于每段音频,通过连通距离设定距离阈值来剔除噪点以提高类内纯净度,完成聚类。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201811484229.1/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top