[发明专利]一种音频信号相似度检测方法在审
申请号: | 201810302809.8 | 申请日: | 2018-04-06 |
公开(公告)号: | CN108597537A | 公开(公告)日: | 2018-09-28 |
发明(设计)人: | 向敏明 | 申请(专利权)人: | 东莞市华睿电子科技有限公司 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L25/78 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 523073 广东省东莞*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频信号 相似度 相似度检测 语音信号 检测 快速傅里叶变换 人工智能 语义分析 语音识别 便利 | ||
本发明提供了一种音频信号相似度检测方法,通过获取待检测相似度的第一音频信号和第二音频信号;分别对所述第一音频信号和第二音频信号依次进行快速傅里叶变换、谱幅度值和谱熵计算,根据所述谱熵确定所述第一音频信号和第二音频信号是否均为语音信号;若均为语音信号则计算其相似度,本发明所提供的音频信号检测方法,由于仅仅涉及到对音频信号本身属性的计算,不涉及到人工智能的语义分析,仅仅通过语音识别,得到音频信号的相似度,因次为音频信号的检测提供了便利。
技术领域
本发明数据处理领域,尤其涉及一种音频信号相似度检测方法。
背景技术
音频信号处理是一个复杂的交叉技术领域。近年来,音频处理技术得到了广泛的应用。
音频处理的基础是语音检测,音频检测的目的是检测语音信号是否存在。
现有技术中,音频检测的过程通常是:获取各音频信号,从各音频信号中提取特征参数进行语义分析,再根据语义分析的结果获知该音频信号是否为语音。
但是,语义分析需要进行大量的计算和模板的匹配,影响了音频检测的效率。
因此,现有技术有待于进一步的改进。
发明内容
鉴于上述现有技术中的不足之处,本发明的目的在于为用户提供一种音频信号相似度检测方法,克服现有技术中音频检测效率低缺陷。
本发明提供的实施例为:一种音频信号相似度检测方法,其中,所述方法包括:
获取待检测相似度的第一音频信号和第二音频信号;
分别对所述第一音频信号和第二音频信号进行快速傅里叶变换得到对应的第一频域信号和第二频域信号;
根据所述第一频域信号计算第一谱幅度值和根据所述第二频域信号计算第二谱幅度值;
分别计算所述第一谱幅度值和所述第二谱幅度值的概率密度,根据所述概率密度计算所述音频信号的谱熵,以及根据所述谱熵确定所述第一音频信号和第二音频信号是否均为语音信号;
若均为语音信号则识别出第一音频信号中含有的第一语言信息和识别出第二音频信号中含有的第二语音信息;
计算出所述第一语音信息和第二语音信息的相似度,并将所述相似度认定为所述第一音频信号和第二音频信号的相似度。
可选的,所述根据所述第一频域信号计算第一谱幅度值和根据所述第二频域信号计算第二谱幅度值的步骤中,采用以下公式进行计算:
其中,X(k,y)表示第y个音频信号所在帧的第k个频段的谱幅度值,z(n,y)表示第y个音频信号所在帧的音频中的第n个点的幅度,N表示快速傅里叶变换的变化长度,k小于或等于N,exp(-j2πkn/N)表示幅角为2π的kn/N倍的复数。
具有的,所述计算所述第一谱幅度值和所述第二谱幅度值的概率密度的步骤包括:
根据所述谱幅度值计算第y个音频信号所在帧的带噪语音功率谱总能量;
根据所述总能量以及所述谱幅度值计算概率密度。
可选的,所述带噪语音功率谱总能量的计算公式为:
较佳的,Esum(y)表示第y个音频信号所在帧的带噪语音功率谱总能量,X(k,y)表示第y个音频信号所在帧的第k个频段的谱幅度值,N表示快速傅里叶变换的变化长度。
较佳的,所述根据所述总能量以及所述谱幅度值计算概率密度的步骤中,采用以下公式进行计算:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东莞市华睿电子科技有限公司,未经东莞市华睿电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810302809.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于声音信息定位的交互系统
- 下一篇:语音合成系统的评测方法和系统