[发明专利]一种语音识别方法、装置及设备有效
申请号: | 201910001000.6 | 申请日: | 2019-01-02 |
公开(公告)号: | CN111402870B | 公开(公告)日: | 2023-08-15 |
发明(设计)人: | 侯雷静 | 申请(专利权)人: | 中国移动通信有限公司研究院;中国移动通信集团有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/06;G10L15/26;G10L25/30 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 许静;安利霞 |
地址: | 100053 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 方法 装置 设备 | ||
本发明提供了一种语音识别方法、装置及设备,其中,语音识别方法包括:利用预设声学特征映射模型对待识别的语音信息进行映射,得到目标语音信息;将目标语音信息识别转换为对应的文本信息;其中,目标语音信息的信号特征与预设信号特征之间相匹配。本方案能够实现充分利用声学特征中的发音特征自适应,从而消除了现有技术中的各地区需要分别训练模型以及必须依照身份ID信息、地域信息来加载模型的弊端,提高了资源利用率、实时响应速度和识别准确率,并降低了空间占用率。
技术领域
本发明涉及数据处理技术领域,特别是指一种语音识别方法、装置及设备。
背景技术
随着运营商手机业务应用的普及,客户群体基数越见庞大,与人工客服的数量具有显著差异;并且许多群体未能掌握应用程序APP端订购业务或自助短信办理业务的技能(如高龄或偏远地区的群体),往往会选择电话拨打人工客服或前往营业厅办理,这无疑会浪费大量时间与服务资源。针对这个问题,现有技术提供一种方案:预先针对不同的地域信息或身份ID信息定制多个声学和语言模型;根据获取的用户身份ID信息或所述地域信息,选择对应的声学和语言模型;将接收到的用户语音信息转为文本信息;并进一步处理从而得到识别结果;以此实现装置自动完成手机业务订购的目的,提升服务效率。
但是,上述方案中:针对不同省份都需要训练地区内的模型,我国地域广袤需要占用大量的资源,这无疑将造成资源利用率的降低和空间占用率的增大;且即使同一省份内,也存在着发音的差异,并不能完全适用所有城市、县镇。
针对每个用户都需要预先获取其身份ID信息与地域信息,预处理模块及模型加载时间的耗费,将造成实时率的下降,使用户的等待回应时间延长。此外,随着社会发展,存在大量人员为寻找工作机会而在异乡临时工作的情况,这种条件下使用身份ID信息或地域信息会造成用户语音识别与模型的不匹配问题,当不匹配性较高,错误率将大幅增大。
发明内容
本发明的目的在于提供一种语音识别方法、装置及设备,解决现有技术中语音识别方案的资源利用率低、空间占用率高、实时响应速度低、识别准确率低的问题。
为了解决上述技术问题,本发明实施例提供一种语音识别方法,包括:
利用预设声学特征映射模型对待识别的语音信息进行映射,得到目标语音信息;
将所述目标语音信息识别转换为对应的文本信息;
其中,所述目标语音信息的信号特征与预设信号特征之间相匹配。
可选的,所述利用预设声学特征映射模型对待识别的语音信息进行映射,得到目标语音信息,包括:
利用预设声学特征映射模型中的卷积层对待识别的语音信息进行卷积操作,得到第一语音信息;
利用预设声学特征映射模型中的池化层对所述第一语音信息进行平均池化操作,得到第二语音信息;
利用预设声学特征映射模型中的网络层对所述第二语音信息进行映射操作,得到目标语音信息。
可选的,所述卷积层的网络为卷积神经网络,所述网络层的激活函数为线性整流函数Relu。
可选的,利用预设声学特征映射模型对待识别的语音信息进行映射,得到目标语音信息之前,还包括:
采用对抗式深度神经网络训练所述预设声学特征映射模型。
可选的,所述采用对抗式深度神经网络训练所述预设声学特征映射模型,包括:
利用公式一,训练所述预设声学特征映射模型,得到所述预设声学特征映射模型的目标参数配置信息;
其中,所述预设声学特征映射模型对应的损失函数包括对经过所述预设声学特征映射模型后的语音信息进行解码输出产生的第一损失函数和对经过所述预设声学特征映射模型后的语音信息进行地域分类产生的第二损失函数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信有限公司研究院;中国移动通信集团有限公司,未经中国移动通信有限公司研究院;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910001000.6/2.html,转载请声明来源钻瓜专利网。