[发明专利]语音识别方法、设备、驾驶设备和介质在审

专利信息
申请号: 202310569593.2 申请日: 2023-05-17
公开(公告)号: CN116597816A 公开(公告)日: 2023-08-15
发明(设计)人: 谢旭康 申请(专利权)人: 蔚来汽车科技(安徽)有限公司
主分类号: G10L15/02 分类号: G10L15/02;G10L15/06;G06N3/0455;G06N3/08;G06N3/084
代理公司: 北京瀚仁知识产权代理事务所(普通合伙) 11482 代理人: 王国赛
地址: 230601 安徽省合肥市经济*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语音 识别 方法 设备 驾驶 介质
【权利要求书】:

1.一种语音识别方法,其特征在于,包括:

对接收的当前语音数据进行音频特征提取,得到第一音频特征信息;

利用预先构造的语音解码器对所述第一音频特征信息进行解码,得到所述当前语音数据对应的识别结果;

其中,所述语音解码器至少基于利用课程学习训练的声学模型构造。

2.根据权利要求1所述的语音识别方法,其特征在于,利用课程学习训练声学模型的步骤包括:

利用多个既有语音识别模型对所获取的原始语音数据进行识别,得到所述原始语音数据的置信度;

选取置信度小于预设置信度的原始语音数据作为训练数据,并发送给数据标注平台;

接收所述数据标注平台反馈的目标训练数据;所述目标训练数据为标注后的训练数据;

基于初始语音识别模型对所述目标训练数据进行识别,得到所述目标训练数据的难度等级;

基于所述目标训练数据的难度等级,生成课程学习方案;

基于所述课程学习方案,对所述初始语音识别模型进行训练,得到所述声学模型。

3.根据权利要求2所述的语音识别方法,其特征在于,基于所述目标训练数据的难度等级,生成课程学习方案,包括:

基于每个难度等级中目标训练数据的元信息进行数据排序,得到排序结果;

基于所述排序结果,根据预设数据集对应的预设数据比例,依次选取每个难度等级下的目标训练数据,得到所述预设数据集;其中,所有所述预设数据集的并集能够覆盖所有目标训练数据;

针对每个预设数据集,基于所述预设数据集中目标训练数据的元信息,划分成多个训练组作为所述课程学习方案。

4.根据权利要求3所述的语音识别方法,其特征在于,对所述初始语音识别模型进行训练,得到所述声学模型,包括:

对每个训练组中目标训练数据进行音频特征提取,得到第二音频特征信息;

利用预先构造的建模字典,将所述第二音频特征信息映射为训练数字序列;

基于所述初始语音识别模型中的编码器对所述第二音频特征信息进行编码,得到编码特征向量;

基于所述初始语音识别模型中的分类解码器对所述编码特征向量进行解码,得到所述特征向量对应的第一数字序列,并基于所述第一数字序列和所述训练数字序列,得到第一语音识别结果的损失值;

基于所述初始语音识别模型中的多头注意力解码器对所述特征向量进行解码,得到所述特征向量对应的第二数字序列,并基于所述第二数字序列和所述训练数字序列,得到第二语音识别结果的损失值;

基于第一语音识别结果的损失值、第一语音识别结果的损失值对应的第一权重值、第二语音识别结果的损失值、第二语音识别结果的损失值对应的第二权重值,利用反向传播算法对所述初始语音识别模型进行优化,直至收敛后得到所述声学模型。

5.根据权利要求4所述的语音识别方法,其特征在于,利用预先构造的建模字典,将所述第二音频特征信息映射为训练数字序列,包括:

若所述第二音频特征信息对应的词汇为建模字典的集内词,将所述建模字典的集内词对应的数字序列赋予所述第二音频特征信息;

若所述第二音频特征信息对应的词汇为建模字典的集外词,根据所述词汇的语言类型对应的映射规则,将所述词汇映射为所述建模字典的集内词,并将所述建模字典的集内词对应的数字序列赋予所述第二音频特征信息。

6.根据权利要求5所述的语音识别方法,其特征在于,根据所述词汇的语言类型对应的映射规则,将所述词汇映射为所述建模字典的集内词,包括:

若所述词汇的语言类型为英文,将所述英文切割成建模字典的集内词中的多个子词,将所述英文映射为所述建模字典的集内词;

若所述词汇的语言类型为中文,根据所述中文的无声调拼音和/或所述中文的字意与建模字典的集内词进行聚类后,将所述中文映射为所述建模字典的集内词。

7.根据权利要求4所述的语音识别方法,其特征在于,基于所述初始语音识别模型中的编码器对所述第二音频特征信息进行编码,得到编码特征向量之前,还包括:

基于预设的无监督学习训练好的参数对所述编码器进行初始化。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于蔚来汽车科技(安徽)有限公司,未经蔚来汽车科技(安徽)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202310569593.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top