[发明专利]一种音频检测方法及装置有效
申请号: | 201610480405.9 | 申请日: | 2016-06-23 |
公开(公告)号: | CN107545904B | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 陈扬坤;陈展;胡林艳 | 申请(专利权)人: | 杭州海康威视数字技术股份有限公司 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G08B21/24 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 马敬;项京 |
地址: | 310052 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音频 检测 方法 装置 | ||
本发明实施例公开了一种音频检测方法及装置,将待检测音频划分为第一预设数量个音频段,采取相同的方式获取每个音频段及音频样本对应的信息集合,计算每个音频段对应的信息集合与音频样本对应的信息集合的相似度,当计算得到的相似度的平均值大于第一预设阈值时,将该音频样本的属性确定为该待检测音频的属性。这样可以仅在待检测音频的属性为需要关注的音频属性时,向监控方发送该音频或提示信息,降低了资源占用率,提高了监控的有效性。
技术领域
本发明涉及监控技术领域,特别涉及一种音频检测方法及装置。
背景技术
随着科技的不断发展,利用音频对场景进行监控的技术已经越来越成熟。比如,目前已经可以利用该技术对婴儿进行监控,以满足婴儿的父母可以远程了解婴儿状况,或者实现照顾婴儿的同时还能完成其他工作。
但是,现有的利用音频对婴儿进行监控的方案只是单纯地将携带有婴儿声音信息的音频发送给监控方,并没有对音频进行检测分析。一方面,如果要实现实时监控,需要持续地发送音频,占用很大的网络资源;另一方面,音频中大部分可能是不需要关注的信息,当偶然出现需要关注的信息时,监控方很可能会忽视掉,监控的有效性不高。
发明内容
本发明实施例的目的在于提供一种音频检测方法及装置,以用于降低资源占用率,提高监控的有效性。
为达到上述目的,本发明实施例公开了一种音频检测方法,包括:
将待检测音频划分为第一预设数量个音频段,并获取每个音频段的声音幅度及声音频率;
根据每个音频段的声音幅度及声音频率,构建每个音频段对应的信息集合;
计算每个音频段对应的信息集合与音频样本对应的信息集合的相似度;
当计算得到的相似度的平均值大于第一预设阈值时,将所述音频样本的属性确定为所述待检测音频的属性。
可选的,所述将待检测音频划分为第一预设数量个音频段,可以包括:
将待检测音频平均划分为第一预设数量个音频段。
可选的,所述根据每个音频段的声音幅度及声音频率,构建每个音频段对应的信息集合,可以包括:
通过以下方式构建每个音频段对应的信息集合:
将目标音频段平均划分为N个音频帧,将每个音频帧平均划分为M个音频单元,其中,所述目标音频段为所述待检测音频的任一音频段;
根据所述目标音频段的声音幅度及声音频率,获得各个音频帧的每一音频单元的声音幅度和声音频率;
根据音频帧的划分顺序,以列为单位,按照每一音频帧中各个音频单元的声音频率由高到低的顺序排列各个音频单元的声音幅度对应的值,进而生成所述目标音频段对应的信息集合。
可选的,所述按照每一音频帧中各个音频单元的声音频率由高到低的顺序排列各个音频单元的声音幅度对应的值,可以包括:
将各个音频单元的声音幅度进行二值归一化处理,得到各个音频单元的声音幅度对应的处理值;
按照每一音频帧中各个音频单元的声音频率由高到低的顺序排列各个音频单元的声音幅度对应的处理值。
可选的,在所述将待检测音频划分为第一预设数量个音频段之前,还可以包括:
计算所述待检测音频的信噪比,判断所述信噪比是否大于第二预设阈值;
如果是,执行所述将待检测音频划分为第一预设数量个音频段的步骤。
为达到上述目的,本发明实施例还公开了一种音频检测装置,包括:
划分模块,用于将待检测音频划分为第一预设数量个音频段;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州海康威视数字技术股份有限公司,未经杭州海康威视数字技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610480405.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:信号处理装置与信号处理方法
- 下一篇:一种呼吸机