[发明专利]语音识别方法、装置及电子设备在审

申请号：	201910477492.6	申请日：	2019-06-03
公开（公告）号：	CN110211588A	公开（公告）日：	2019-09-06
发明（设计）人：	李杰;王晓瑞;李岩	申请（专利权）人：	北京达佳互联信息技术有限公司
主分类号：	G10L15/26	分类号：	G10L15/26;G10L15/02
代理公司：	北京三高永信知识产权代理有限责任公司 11138	代理人：	祝亚男
地址：	100085 北京市海淀***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本公开是关于一种语音识别方法、装置及电子设备，属于音频处理领域。所述方法包括：对语音数据进行特征提取，得到所述语音数据的语音特征；将所述语音特征输入声学模型，通过所述声学模型包括的多个特征抽取层和柔性最大值传输函数softmax层，确定所述语音特征对应的音节数据，其中，所述声学模型用于将语音特征转化为音节数据；根据语言模型、发音词典以及所述音节数据，确定所述语音数据对应的文本数据，输出所述文本数据，其中，所述发音词典用于将音节数据转化为对应的文本数据，所述语言模型用于对转化得到的文本数据进行评估。采用本公开，可以提高语音识别的准确性。
搜索关键词：	文本数据音节数据语音特征声学模型语音识别语音数据装置及电子设备发音词典语言模型转化传输函数特征抽取特征提取音频处理输出评估
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种语音识别方法，其特征在于，所述方法包括：对语音数据进行特征提取，得到所述语音数据的语音特征；将所述语音特征输入声学模型，通过所述声学模型包括的多个特征抽取层和柔性最大值传输函数softmax层，确定所述语音特征对应的音节数据，其中，所述声学模型用于将语音特征转化为音节数据；根据语言模型、发音词典以及所述音节数据，确定所述语音数据对应的文本数据，输出所述文本数据，其中，所述发音词典用于将音节数据转化为对应的文本数据，所述语言模型用于对转化得到的文本数据进行评估。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司，未经北京达佳互联信息技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910477492.6/，转载请声明来源钻瓜专利网。

上一篇：排号信息获取方法、装置、设备及介质
下一篇：车载系统的唤醒方法、装置以及车辆、机器可读介质

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]语音识别方法、装置及电子设备在审

专利文献下载