[发明专利]语音识别方法、装置和控制器有效
申请号: | 201811639786.6 | 申请日: | 2018-12-29 |
公开(公告)号: | CN111383641B | 公开(公告)日: | 2022-10-18 |
发明(设计)人: | 黄佑佳;聂为然;于海;翁富良 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/06;G10L15/02;G10L15/18;G10L13/10;G10L25/30 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 装置 控制器 | ||
1.一种语音识别方法,其特征在于,包括:
获取用户输入的语音信号所对应的文本数据,将所述文本数据转换为音节序列,所述文本数据由语音识别引擎转换所述语音信号得到;
基于所述音节序列和对应所述用户的第一音节转移概率分布T,确定所述音节序列对应的音节转移概率,所述音节转移概率包括所述音节序列中每一音节对应真实音节的转移概率;
基于所述音节转移概率和预先构建的语言模型,确定所述音节序列对应的候选音节文本,并输出。
2.根据权利要求1所述的方法,其特征在于,预先建立的对应所述用户的第一音节转移概率分布T的过程,包括:
获取用户真实语音样本对应的真实音节序列U,以及语音识别引擎识别所述用户真实语音样本得到的识别音节序列V;
基于所述真实音节序列U和所述识别音节序列V,确定所述识别音节序列V中每一个音节的条件概率;
计算所述识别音节序列V中每一个音节的条件概率的乘积,得到第一音节转移概率分布T,所述第一音节转移概率分布T为p(V|U)。
3.根据权利要求1所述的方法,其特征在于,预先建立的对应所述用户的第一音节转移概率分布T的过程,包括:
获取用户真实语音样本对应的真实音节序列U,以及语音识别引擎识别所述用户真实语音样本得到的识别音节序列V;
将所述真实音节序列U中的真值音节ui和所述识别音节序列V中的识别音节vi一一对应比对,统计任一所述真值音节ui出现在所述真实音节序列U中的第一频次,及所述真值音节ui对应位置的识别音节vi出现的第二频次;
基于所述第一频次和第二频次,确定所述识别音节vi的第二音节转移概率p(vi|ui);
统计并利用所有所述识别音节vi的第二音节转移概率p(vi|ui)建立对应所述用户的第一音节转移概率分布T,所述第一音节转移概率分布T为p(V|U)。
4.根据权利要求1-3中任一项所述的方法,其特征在于,还包括:
确定基于普通话语料样本训练得到的第二音节转移概率分布Tm,基于口音群体语料样本训练得到的第三音节转移概率分布Tg,以及基于用户的真实语料样本训练得到的第四音节转移概率分布Tp;
获取预设时间段内第四音节转移概率分布Tp中任一音节对应的音节转移概率Tp(x,y),x和y用于指示所述音节转移概率Tp(x,y)在所述第四音节转移概率分布Tp中的坐标位置;
当所述音节转移概率Tp(x,y)大于0时,利用所述音节转移概率Tp(x,y)更新所述第一音节转移概率分布T;
当所述音节转移概率Tp(x,y)小于0时,将音节转移概率Tg(x,y)赋值于所述音节转移概率Tp(x,y)更新所述第一音节转移概率分布T,所述音节转移概率Tg(x,y)指所述音节对应的口音识别概率。
5.根据权利要求1-3中任一项所述的方法,其特征在于,还包括:
基于半监督方法对所述第一音节转移概率分布T进行更新。
6.根据权利要求1-3中任一项所述的方法,其特征在于,在所述确定所述音节序列对应的候选音节文本,并输出之后,还包括:
获取所述用户反馈的所述候选音节文本是否与所述语音信号一致的反馈信息;
若所述反馈信息为所述候选音节文本与所述语音信号一致,则基于所述候选音节文本对应的所述音节序列更新所述第一音节转移概率分布T。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811639786.6/1.html,转载请声明来源钻瓜专利网。