[发明专利]一种提取声音的基音频率的方法、装置及可读存储介质有效
申请号: | 201710989739.3 | 申请日: | 2017-10-20 |
公开(公告)号: | CN107833581B | 公开(公告)日: | 2021-04-13 |
发明(设计)人: | 劳振锋 | 申请(专利权)人: | 广州酷狗计算机科技有限公司 |
主分类号: | G10L25/18 | 分类号: | G10L25/18;G10L25/03 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 胡海国 |
地址: | 510000 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 提取 声音 基音 频率 方法 装置 可读 存储 介质 | ||
本发明公开了一种提取声音的基音频率方法、装置及可读存储介质。本发明首先获取待检测声音信号,通过短时傅里叶变换将待检测声音信号从时域转化到频域;然后从所述频域中确定待检测声音信号的频带范围,根据所述频带范围确定所述待检测声音信号的最大谐波次数;再对所述频带范围内的各频点分别进行能量强度检测,根据强度检测结果确定能量强度最大的频点a;最后根据所述频点a和所述最大谐波次数判断是否存在极大值点的待测频点,若存在,则该待测频点可能是所述待检测声音信号的基音频率或者是基音频率的谐波分量,最后从所述待检测声音信号中提取基音频率。本发明所提供的提取声音的基音频率方法能够用较低的算法复杂度实现较高的准确率。
技术领域
本发明涉及音频信号技术领域,尤其涉及一种提取声音的基音频率方法、装置及可读存储介质。
背景技术
基音频率简称基频,当发声体由于振动而发出声音时,声音一般可以分解为许多单纯的正弦波,所有的自然声音基本都是有许多频率不同的正弦波组成的,其中频率最低的正弦波即为基音,而其他的频率较高的正弦波则为谐波。比如基音频率是可以反映人声音高的基本特征,一般判断一个人唱歌音准是否正确,需要提取人声的基音频率得到音高来进行判断。
目前基音频率检测的方法有时域自相关法、频域倒谱计算法、频域离散小波变换法等等,但是这些检测基音频率的方法要么算法比较复杂,要么存在检测的准确率不高等缺点。本发明的基频检测方法用较低的算法复杂度,实现了较高的准确率。
发明内容
本发明的主要目的在于提供了一种提取声音的基音频率方法、装置,及可读存储介质,旨在解决目前基音频率检测方法算法复杂度较高及检测精度较低的问题。
为实现上述目的,本发明提供了一种提取声音的基音频率方法,所述方法包括以下步骤:
获取待检测声音信号,通过短时傅里叶变换将所述待检测声音信号从时域转化到频域;
从所述频域中确定待检测声音信号的频带范围,根据所述频带范围确定所述待检测声音信号的最大谐波次数;
对所述频带范围内的各频点分别进行能量强度检测,根据强度检测结果确定能量强度最大的频点a;
根据所述频点a和所述最大谐波次数从所述待检测声音信号中提取基音频率。
优选地,所述根据所述频点a和所述最大谐波次数从所述待检测声音信号中提取基音频率,具体包括:
将变量n设置为所述最大谐波次数;
根据所述变量n计算与所述频点a对应的待测频点;
判断各待测频点是否满足第一预设条件;
当各待测频点不满足所述第一预设条件时,将所述变量n进行自减1,并返回所述根据所述变量n计算与所述频点a对应的待测频点的步骤,直至各待测频点满足所述第一预设条件时,将所述频点a与所述变量n的商作为所述待检测声音信号的基音频率。
优选地,所述根据变量n计算与所述频点a对应的待测频点,具体包括:
将变量m设置为1;
根据公式(1)计算与所述频点a对应的待测频点f;
将所述变量m自增1,并重新根据所述公式(1)计算与所述频点a对应的待测频点,直至m=n-1时,将计算的各待测频点作为所述频点a对应的待测频点;
其中,所述公式(1)为
优选地,所述根据变量n计算与所述频点a对应的待测频点之后,所述方法还包括:
对所述待测频点进行四舍五入取整。
优选地,所述将所述变量n进行自减1之后,所述方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州酷狗计算机科技有限公司,未经广州酷狗计算机科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710989739.3/2.html,转载请声明来源钻瓜专利网。