[发明专利]语音识别方法和装置有效
申请号: | 201811143178.6 | 申请日: | 2018-09-28 |
公开(公告)号: | CN110970018B | 公开(公告)日: | 2022-05-27 |
发明(设计)人: | 易斌;连园园;陈浩广;肖龙 | 申请(专利权)人: | 珠海格力电器股份有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26;G10L17/04;G10L21/0208;G10L15/06;G10L15/00 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 赵囡囡;董文倩 |
地址: | 519070 *** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 装置 | ||
1.一种语音识别方法,其特征在于,包括:
获取语音信息;
基于所述语音信息,将所述语音信息输入至语种判断模型,其中,所述语种判断模型输出所述语音信息属于每个候选语种的概率;根据所述每个候选语种对应的概率确定所述语音信息所属的语种,其中,所述语种判断模型根据训练数据进行训练得到,所述训练数据包括:多个语种的语音信息和用于表示所述语音信息所属语种的标签,根据所述每个候选语种对应的概率确定所述语音信息所属的语种,包括:获取预设的候选语种和所述候选语种对应的权重;根据所述每个候选语种对应的概率和所述每个候选语种的权重,确定所述语音信息所属的语种;
根据语言信息所属的语种调用对应的语言转换模块,将所述语音信息转换为对应的文字信息。
2.根据权利要求1所述的方法,其特征在于,获取语音信息,包括:
获取采集到的声音信息;
对所述声音信息进行去噪处理,得到目标对象的所述语音信息。
3.根据权利要求1所述的方法,其特征在于,在根据语言信息所属的语种调用对应的语言转换模块,将所述语音信息转换为对应的文字信息之后,所述方法还包括:
获取预设的文字显示类型;
根据所述文字显示类型显示所述文字信息。
4.根据权利要求1所述的方法,其特征在于,在获取语音信息之前,所述方法还包括:获取所述语种判断模型,其中,获取所述语种判断模型,包括:
获取所述训练数据和初始卷积神经网络模型,其中,所述初始卷积神经网络模型具有初始网络参数;
使用所述训练数据对所述初始卷积神经网络模型进行训练,得到目标网络参数,其中,所述目标网络参数用于构成所述语种判断模型。
5.一种语音识别装置,其特征在于,包括:
获取模块,用于获取语音信息;
确定模块,用于基于所述语音信息,将所述语音信息输入至语种判断模型,其中,所述语种判断模型输出所述语音信息属于每个候选语种的概率;根据所述每个候选语种对应的概率确定所述语音信息所属的语种,其中,所述语种判断模型根据训练数据进行训练得到,所述训练数据包括:多个语种的语音信息和用于表示所述语音信息所属语种的标签,根据所述每个候选语种对应的概率确定所述语音信息所属的语种,包括:获取预设的候选语种和所述候选语种对应的权重;根据所述每个候选语种对应的概率和所述每个候选语种的权重,确定所述语音信息所属的语种;
转换模块,用于根据语言信息所属的语种调用对应的语言转换模块,将所述语音信息转换为对应的文字信息。
6.根据权利要求5所述的装置,其特征在于,获取模块包括:
获取子模块,用于获取采集到的声音信息;
处理子模块,用于对所述声音信息进行去噪处理,得到目标对象的所述语音信息。
7.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至4中任意一项所述的语音识别方法。
8.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至4中任意一项所述的语音识别方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海格力电器股份有限公司,未经珠海格力电器股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811143178.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:撑杆羽毛球网架
- 下一篇:空调的控制方法和装置