[发明专利]一种语音识别的方法及装置在审
申请号: | 202010753634.X | 申请日: | 2020-07-30 |
公开(公告)号: | CN111883113A | 公开(公告)日: | 2020-11-03 |
发明(设计)人: | 李旭滨;沈华东 | 申请(专利权)人: | 云知声智能科技股份有限公司;厦门云知芯智能科技有限公司 |
主分类号: | G10L15/183 | 分类号: | G10L15/183;G10L15/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100096 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 方法 装置 | ||
1.一种语音识别方法,其特征在于,所述方法包括:
增加声学模型的场景分类信息;
获取待测语音在所述场景分类信息下的声学模型输出,并确定符合条件的场景;
动态加载所述符合条件的场景相应的语音模型,获得语音识别的结果。
2.根据权利要求1所述的方法,其特征在于,所述增加声学模型的场景信息,具体为:
通过语音训练数据中增加场景分类标签,使声学模型增加场景分类信息。
3.根据权利要求1所述的方法,其特征在于,所述获取待测语音在所述场景分类信息下的声学模型输出,确定适合的场景,具体为:
获取待测语音在所述场景分类信息下的声学模型输出;
求待测语音的语音帧的场景概率平均值;
基于所述平均值,确定阈值;
根据阈值选择所述待测语音符合条件的场景。
4.根据权利要求3所述的方法,其特征在于,所述阈值为0.8。
5.根据权利要求3所述的方法,其特征在于,基于识别速度和识别速率求符合条件的场景。
6.一种语音识别设备,其特征在于,所述设备包括:
增加场景模块,用于增加声学模型的场景分类信息;
第一处理模块,用于获取待测语音的声学模型输出,并确定符合条件的场景;
第二处理模块,用于动态加载所述符合条件的场景相应的语音模型,获得语音识别的结果。
7.根据权利要求6所述的设备,其特征在于,所述第一处理模块包括获取模块、计算模块、确定模块和选择模块;
所述获取模块,用于获取待测语音的声学模型输出;
所述计算模块,用于求待测语音的语音帧的场景概率平均值;
所述确定模块,用于基于所述平均值,确定阈值;
所述选择模块,用于根据阈值选择所述待测语音符合条件的场景。
8.一种语音识别系统,其特征在于,所述系统包括至少一个处理器和存储器;
所述存储器,用于存储一个或多个程序指令;
所述处理器,用于运行一个或多个程序指令,用以执行如权利要求1至5中一个或多个所述的方法。
9.一种芯片,其特征在于,所述芯片与系统中的存储器耦合,使得所述芯片在运行时调用所述存储器中存储的程序指令,实现如权利要求1至5中一个或多个所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括一个或多个程序指令,所述一个或多个程序指令可被如权利要求8所述的系统执行,以实现如权利要求1至5中一个或多个所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云知声智能科技股份有限公司;厦门云知芯智能科技有限公司,未经云知声智能科技股份有限公司;厦门云知芯智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010753634.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于防控电话机器人的数据处理方法及装置
- 下一篇:污水处理用的加药管道系统