[发明专利]语音识别方法、装置、计算机设备及可读存储介质有效
申请号: | 201711374166.X | 申请日: | 2017-12-19 |
公开(公告)号: | CN107993666B | 公开(公告)日: | 2021-01-29 |
发明(设计)人: | 卫东雷;李行;单衍景 | 申请(专利权)人: | 北京华夏电通科技股份有限公司 |
主分类号: | G10L17/14 | 分类号: | G10L17/14;G10L21/0208;G10L21/0216 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 汤在彦;周晓飞 |
地址: | 100094 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 装置 计算机 设备 可读 存储 介质 | ||
1.一种语音识别方法,其特征在于,包括:
在一组话筒中有话筒被使用时,采集所述一组话筒中各个话筒的声纹数据,其中,所述一组话筒中相邻两个话筒之间的距离小于预设距离;
分别提取各个话筒的声纹数据的特征参数,其中,所述特征参数用于表征声纹曲线的趋势特征;
根据所述特征参数分别计算相邻两个话筒的声纹数据的差异值,其中,所述差异值表示相邻两个话筒的声纹数据的相似度;
根据大于预设数值的差异值对应的相邻两个话筒的声纹数据的能量大小,在大于预设数值的差异值对应的相邻两个话筒的声纹数据中确定出当前被使用的话筒的声纹数据,将当前被使用的话筒的声纹数据作为识别文本,将所有话筒的声纹数据中除了所述识别文本之外的其他声纹数据确定为重复识别文本,采用所述识别文本对当前被使用的话筒进行语音识别;
根据所述特征参数分别计算相邻两个话筒的声纹数据的差异值,包括:
针对各个话筒的声纹数据,根据每个话筒的声纹数据的特征参数从特征参数与影响因子的对应关系中选择每个话筒的声纹数据的影响因子,其中,特征参数包括:基础轨迹特征参数、梅尔倒谱特征参数以及声音强度参数,梅尔倒谱特征参数、声音强度参数和影响因子的对应关系的公式为:μ=f(x,y)=x2+y2(x∈[-5,+5]y∈[-5,+5]),μ代表影响因子,x代表梅尔倒谱特征参数,y代表声音强度参数;
根据每个话筒的声纹数据的特征参数和影响因子,计算每个话筒的声纹数据对应的特征系数,通过以下公式计算特征系数:其中,f(x)表示当前声纹的特征系数;π表示圆周率;σ表示当前声纹的基础轨迹特征参数;x表示上一个时间段声纹的特征系数,初始值为0;μ表示影响因子;e是无理数,为自然对数的底数;
根据每个话筒的声纹数据对应的特征系数,利用模糊决策法分别计算相邻两个话筒的声纹数据的差异值,其中,差异值的数值越大,则相邻两个话筒的声纹数据的相似度越低。
2.如权利要求1所述的语音识别方法,其特征在于,在分别提取各个话筒的声纹数据的特征参数之前,还包括:
针对各个话筒的声纹数据,实时动态确定各个话筒的声纹数据的噪声频谱;
过滤各个话筒的声纹数据中的噪声。
3.如权利要求2所述的语音识别方法,其特征在于,通过以下公式实时动态确定各个话筒的声纹数据的噪声频谱:
其中,是当前的噪声频谱估计;lambdaNSE是噪声频谱估计参数;是前一时间段的噪声频谱估计;是噪声频谱的动态更新值;tn-1是前一个非语音帧指数减1;EPS是的初始值;t是当前帧指数;tn是前一个非语音帧指数。
4.如权利要求2所述的语音识别方法,其特征在于,通过以下公式过滤各个话筒的声纹数据中的噪声:
其中,H2(bin,t1)是维纳滤波传输函数;η2(bin,t1)是前一帧的信噪比;bin是标识频率指数;t1是时间;NSPEC是帧当前频率的最大值。
5.如权利要求1所述的语音识别方法,其特征在于,分别提取各个话筒的声纹数据的特征参数,包括:
针对各个话筒的无噪声的声纹数据,分别提取所述特征参数,其中,所述特征参数包括:基础轨迹特征参数、梅尔倒谱特征参数以及声音强度参数。
6.如权利要求1至5中任一项所述的语音识别方法,其特征在于,根据大于预设数值的差异值对应的相邻两个话筒的声纹数据的能量大小,在大于预设数值的差异值对应的相邻两个话筒的声纹数据中确定出当前被使用的话筒的声纹数据,将当前被使用的话筒的声纹数据作为识别文本,包括:
针对大于预设数值的差异值对应的相邻两个话筒的声纹数据,将能量大的声纹数据确定为当前被使用的话筒的声纹数据,将当前被使用的话筒的声纹数据作为识别文本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京华夏电通科技股份有限公司,未经北京华夏电通科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711374166.X/1.html,转载请声明来源钻瓜专利网。