[发明专利]一种基于场景建模的公共场所异常声音检测方法有效
申请号: | 201610638937.0 | 申请日: | 2016-08-05 |
公开(公告)号: | CN106251861B | 公开(公告)日: | 2019-04-23 |
发明(设计)人: | 杨利平;张丽君;辜小花;龚卫国;李伟红;李正浩 | 申请(专利权)人: | 重庆大学 |
主分类号: | G10L15/08 | 分类号: | G10L15/08;G10L15/18 |
代理公司: | 重庆飞思明珠专利代理事务所(普通合伙) 50228 | 代理人: | 刘念芝 |
地址: | 400030 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明是一种基于场景建模的公共场所异常声音检测方法,该方法根据公共场所场景声音相对异常声音平均幅值小,波动范围较窄的统计特性,首先计算各场景声音信号的平均幅值,并基于期望最大化算法建立不同场景的高斯混合模型;然后求取待测声音信号与场景模型的似然度,进行似然度匹配,再基于多数投票原则和最小连续帧数的阈值条件判定待测声音帧是否为异常声音,从而实现异常声音的检测。本发明相对现有的异常声音检测方法,场景适应性更强,检测的错误率更低,同时检测的实时性和效率也较高。 | ||
搜索关键词: | 一种 基于 场景 建模 公共场所 异常 声音 检测 方法 | ||
【主权项】:
1.一种基于场景建模的公共场所异常声音检测方法,其特征在于:首先对公共场所的声音信号进行分帧处理,计算每帧信号的平均幅值;然后根据场景声音帧相对异常声音帧平均幅值小,波动范围较窄的统计特性,用EM算法训练场景音信号,建立适应于该场景的高斯混合模型,形成该场景的场景模型;最后计算待测声音信号与场景模型的似然度,并进行似然度匹配得出检测结果,即先将所得似然度与场景模型的似然度阈值进行比较,再基于阈值条件判定待测声音帧是否为异常声音,实现异常声音的检测;所述方法具体包括场景建模和异常声音检测两个部分:(1)场景建模的过程为:(1.1)对训练数据中的场景声音样本和异常声音样本进行分帧处理,计算每帧声音信号的平均幅值;(1.2)将每帧声音信号的平均幅值作为输入数据,针对不同场景建立表征场景的高斯混合模型,并利用训练数据中已知类别信息的场景声音样本和异常声音样本对建立的场景模型进行评估,基于等错误率原则确定场景模型的似然度阈值;(2)异常声音检测的步骤为:(2.1)对待测声音信号进行分帧预处理,计算每帧声音信号的平均幅值;(2.2)根据应用场景的不同选择不同的场景模型,计算每帧信号与场景模型的似然度;(2.3)对每帧声音信号进行似然度匹配,再判定待测声音帧是否为异常声音,实现异常声音检测。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610638937.0/,转载请声明来源钻瓜专利网。