[发明专利]一种音频信号相似度检测方法在审
申请号: | 201810302809.8 | 申请日: | 2018-04-06 |
公开(公告)号: | CN108597537A | 公开(公告)日: | 2018-09-28 |
发明(设计)人: | 向敏明 | 申请(专利权)人: | 东莞市华睿电子科技有限公司 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L25/78 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 523073 广东省东莞*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频信号 相似度 相似度检测 语音信号 检测 快速傅里叶变换 人工智能 语义分析 语音识别 便利 | ||
1.一种音频信号相似度检测方法,其特征在于,所述方法包括:
获取待检测相似度的第一音频信号和第二音频信号;
分别对所述第一音频信号和第二音频信号进行快速傅里叶变换得到对应的第一频域信号和第二频域信号;
根据所述第一频域信号计算第一谱幅度值和根据所述第二频域信号计算第二谱幅度值;
分别计算所述第一谱幅度值和所述第二谱幅度值的概率密度,根据所述概率密度计算所述音频信号的谱熵,以及根据所述谱熵确定所述第一音频信号和第二音频信号是否均为语音信号;
若均为语音信号则识别出第一音频信号中含有的第一语言信息和识别出第二音频信号中含有的第二语音信息;
计算出所述第一语音信息和第二语音信息的相似度,并将所述相似度认定为所述第一音频信号和第二音频信号的相似度。
2.根据权利要求1所述的音频信号相似度检测方法,其特征在于,所述根据所述第一频域信号计算第一谱幅度值和根据所述第二频域信号计算第二谱幅度值的步骤中,采用以下公式进行计算:
其中,X(k,y)表示第y个音频信号所在帧的第k个频段的谱幅度值,z(n,y)表示第y个音频信号所在帧的音频中的第n个点的幅度,N表示快速傅里叶变换的变化长度,k小于或等于N,exp(-j2πkn/N)表示幅角为2π的kn/N倍的复数。
3.根据权利要求1所述的音频信号相似度检测方法,其特征在于,所述计算所述第一谱幅度值和所述第二谱幅度值的概率密度的步骤包括:
根据所述谱幅度值计算第y个音频信号所在帧的带噪语音功率谱总能量;
根据所述总能量以及所述谱幅度值计算概率密度。
4.根据权利要求3所述的音频信号相似度检测方法,其特征在于,所述带噪语音功率谱总能量的计算公式为:
其中,Esum(y)表示第y个音频信号所在帧的带噪语音功率谱总能量,X(k,y)表示第y个音频信号所在帧的第k个频段的谱幅度值,N表示快速傅里叶变换的变化长度。
5.根据权利要求4所述的音频信号相似度检测方法,其特征在于,所述根据所述总能量以及所述谱幅度值计算概率密度的步骤中,采用以下公式进行计算:
D(k,y)=|X(k,y)|2/Esum(y);
其中,D(k,y)表示第y个音频信号所在帧的第k个频段所对应的概率密度,X(k,y)表示第y个音频信号所在帧的第k个频段的谱幅度值。
6.根据权利要求5所述的音频信号相似度检测方法,其特征在于,根据所述概率密度计算所述音频信号的谱熵的具体过程:
其中,H(y)表示第y个音频信号的谱熵,D(k,y)表示第y个音频信号所在帧的第k个频段所对应的概率密度。
7.根据权利要求6所述的音频信号相似度检测方法,其特征在于,所述根据所述谱熵确定所述音频信号是否为语音信号的步骤包括:
计算所述音频信号的能量;
根据所述音频信号的能量以及所述谱熵确定所述音频信号是否为语音信号;
所述计算所述音频信号的能量的公式为:
其中,E(y)表示第y个音频信号的能量,M表示音频信号所在帧的帧长,z(n,y)表示第y个音频信号所在帧的音频中的第n个点的幅度;
根据所述音频信号的能量以及所述谱熵确定所述音频信号是否为语音信号的步骤包括:
判断P(y)是否大于预置门限值,若是,则确定音频信号是语音信号,若否,则确定音频信号不是语音信号,其中,
8.根据权利要求7所述的音频信号相似度检测方法,其特征在于,所述若均为语音信号则识别出第一音频信号中含有的第一语言信息和识别出第二音频信号中含有的第二语音信息的步骤包括:
将音频信号与数据库中存储的数据进行比对,或者将所述音频信号发送至云端服务器,并获取云端服务器返回的与第一音频信号和第二音频信号相对应的第一语音信息和第二语音信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东莞市华睿电子科技有限公司,未经东莞市华睿电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810302809.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于声音信息定位的交互系统
- 下一篇:语音合成系统的评测方法和系统