[发明专利]训练滤波模型的方法和语音识别的方法有效

专利信息
申请号: 201711065322.4 申请日: 2017-11-02
公开(公告)号: CN109754784B 公开(公告)日: 2021-01-29
发明(设计)人: 聂为然;于海 申请(专利权)人: 华为技术有限公司
主分类号: G10L15/06 分类号: G10L15/06
代理公司: 北京龙双利达知识产权代理有限公司 11329 代理人: 时林;毛威
地址: 518129 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 训练 滤波 模型 方法 语音 识别
【说明书】:

本申请提供一种训练滤波模型的方法和装置,可应用到自动驾驶领域的智能汽车上,包括:确定N个原始音节,该N个原始音节是第一语料的实际读音所包括的音节;确定N个识别音节,该N个识别音节是第一语料的声音信号经过第一语音识别处理而获得的识别结果的音节,第一语音识别处理包括基于滤波模型的滤波处理和基于语音识别引擎的识别处理;根据N个原始音节和N个识别音节,确定N个音节距离,N个音节距离与N个音节对一一对应,N个原始音节和N个识别音节构成N个音节对,每个音节对包括彼此对应的原始音节和识别音节,每个音节距离用于指示所对应的音节对所包括的原始音节和识别音节之间的相似度,从而,有利于提高语音识别引擎的识别准确率。

技术领域

本申请涉及语音识别技术领域,并且更具体地,涉及一种训练滤波模型的方法、语音识别的方法、训练设备、语音识别设备和语音识别系统。

背景技术

自动语音识别(Automatic Speech Recognition,ASR)是语音交互系统的关键技术,ASR引擎(也可以称为语音识别引擎)负责将语音信号转换成文本。图1是ASR引擎进行语音识别的一例的示意性图。如图1所述,经过拾音设备对声音进行采集,获得语音信号经过特征模块提取(频域)特征后,由声学模型转换为音节序列(例如,汉语拼音中的声母和韵母序列)。再通过解码器(decoder)在语言模型中搜索出该音节序列所对应的字符序列(例如,汉字序列)。

但是,现有技术中,语言模型中音节序列与字符序列之间的对应关系是基于预设的数据库训练得到的,在实际使用中,受到环境和用户的发音习惯等的影响,可能导致对于同一语音在数据库中的声音信号与实际采集到的声音信号不一致,导致最终的无法识别出该语音。

发明内容

本申请提供一种用于训练滤波模型的方法与设备,有利于提高语音识别引擎进行语音识别的准确率。

第一方面,提供了一种训练滤波模型的方法,所述方法包括:确定N个原始音节,所述N个原始音节是第一语料的实际读音所包括的音节,N为大于或等于1的整数;确定N个识别音节,所述N个识别音节是所述第一语料的声音信号经过第一语音识别处理而获得的识别结果的音节,所述第一语音识别处理包括基于所述滤波模型的滤波处理和基于语音识别引擎的识别处理,所述N个识别音节和所述N个原始音节一一对应;根据所述N个原始音节和所述N个识别音节,确定N个音节距离,其中,所述N个音节距离与N个音节对一一对应,所述N个原始音节和所述N个识别音节构成N个音节对,每个音节对包括彼此对应的一个原始音节和一个识别音节,每个音节距离用于指示所对应的音节对所包括的原始音节和识别音节之间的相似度;根据所述N个音节距离,对所述滤波模型进行训练。

可选地,原始音节和识别音节之前的“相似度”可以根据原始音节和识别音节之前的误字率或误音节率确定。

例如,原始音节和识别音节之前的误字率或误音节率越高,原始音节和识别音节之前的相似度越低。

其中,原始音节和识别音节之前的误字率可以是指原始音节对应的多个文字(或字母)与识别音节对应的多个文字(或字母)中,发生识别错误文字(或字母)在该多个文字中的比例。即,误字率的值为错误识别的字的个数与总字数的比值。

原始音节和识别音节之前的误字率可以是指原始音节对应的多个音节与识别音节对应的多个音节中,发生识别错误音节在该多个音节中的比例。即,误音节率的值为错误识别的音节的个数与总音节数的比值。

可选地,该根据该N个音节距离,对该滤波模型进行训练,包括:根据该N个音节距离,对该滤波模型进行训练,以使第二语料对应的M个音节距离中的每个音节距离的大小在第一预设范围内,其中,该M个音节距离与M个音节对一一对应,该M个音节对所包括的M个原始音节是第二语料的实际读音所包括的音节,该M个音节对所包括的M个识别音节是该第二语料的声音信号经过第二语音识别处理而获得的识别结果的音节,M为大于或等于1的整数,该第二语音识别处理包括基于经过训练后的滤波模型的滤波处理和基于该语音识别引擎的识别处理。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711065322.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top