[发明专利]一种离散点的语音基音识别装置及计算机存储介质在审
申请号: | 202110375951.7 | 申请日: | 2021-04-08 |
公开(公告)号: | CN113113052A | 公开(公告)日: | 2021-07-13 |
发明(设计)人: | 陈夏盛;林荔珊 | 申请(专利权)人: | 深圳市品索科技有限公司 |
主分类号: | G10L25/90 | 分类号: | G10L25/90;G10L25/18;G10L21/0208 |
代理公司: | 深圳市辉泓专利代理有限公司 44510 | 代理人: | 刘海军 |
地址: | 518000 广东省深圳市龙岗*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 离散 语音 基音 识别 装置 计算机 存储 介质 | ||
本发明提供了一种离散点的语音基音识别装置,包括语音接收模块、去噪模块、基音粗算模块、基音精算模块和基音提取模块,所述语音接收模块接收外部的语音并转换成离散点信号,所述去噪模块对所述离散点信号进行去噪处理,所述基音粗算模块用于对离散点进行计算处理得到一个基音的频率范围,所述基音精算模块在所述频率范围内进行计算处理得到基音的频率值,所述基音提取模块根据所述频率值从语音中提取出基音。本发明先通过所述基音粗算模块对基音的频率范围进行缩小限定,再通过所述基音精算模块计算出准确的基音频率值,大大地减小了计算的复杂程度,提高识别效率。
技术领域
本发明涉及语音识别技术领域,尤其涉及一种离散点的语音基音识别装置。
背景技术
基音是指发浊音时声带振动的周期,基音周期的估计称为基音检测,其目的是提取出与声带振动频率一致或尽可能相吻合的基音周期变化的轨迹曲线,是语音信号处理中最重要的特征参数之一,在旋律辨识、声调辨识、语音合成和语音编码等研究领域起着非常关键的作用。基音检测算法用于检测基音信号的方法。由于语音信号可视为一个动态非平稳随机过程,语音波形和声带振动的频率变化范围大且十分复杂。
现在已经开发出了很多基音识别系统,经过我们大量的检索与参考,发现现有的识别系统有如公开号为KR100538987B1,KR1019970050104A和KR100538985B1所公开的系统,包括以下步骤:语音信号的采集输入、语音信号预处理、语音信号组合特征参数提取:即提取基音周期、LPCC、ΔLPCC、能量、能量的一阶差分、GFCC特征参数共同组合成多维特征向量、采用离散二进制粒子群优化算法对多维特征参数进行筛选、引入通用背景模型UBM训练得到说话人的声音模型、最后利用GMM-UBM模型对测试语音进行识别。但该系统计算量大,过程较复杂,效率较低,不能快速地识别出基音。
发明内容
本发明的目的在于,针对所存在的不足,提出了一种离散点的语音基音识别装置,
为了克服现有技术的不足,本发明采用如下技术方案:
一种离散点的语音基音识别装置,包括语音接收模块、去噪模块、基音粗算模块、基音精算模块和基音提取模块,所述语音接收模块接收外部的语音并转换成离散点信号,所述去噪模块对所述离散点信号进行去噪处理,所述基音粗算模块用于对离散点进行计算处理得到一个基音的频率范围,所述基音精算模块在所述频率范围内进行计算处理得到基音的频率值,所述基音提取模块根据所述频率值从语音中提取出基音;
进一步的,所述语音接收模块内设有语音接收电路和模数转换单元,所述语音接收电路将语音振动转换成连续的电信号,所述模数转换单元将连续的电信号转换成离散的数字信号S(m);
进一步的,所述去噪模块利用如下去噪公式进行去噪处理:
其中,k0为去噪点;
进一步的,所述去噪点k0通过去噪指数公式P(k)来确定:
对于任意自然数k,P(k0)满足P(k0)<P(k);
进一步的,所述基音粗算模块从数字信号中以所述去噪点为长度提取出若干分析帧,所述分析帧与分析窗函数计算得到若干分析窗数列:
第i分析窗数列:
其中,分析窗函数为:
进一步的,将所述分析窗数列重新组合后获取峰值和谷值,相邻峰值与谷值之间的距离的最大值Lmax和最小值Lmin对应的时间为基音周期范围[Δtmin,Δtmax];
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市品索科技有限公司,未经深圳市品索科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110375951.7/2.html,转载请声明来源钻瓜专利网。