[发明专利]生成语音指令的方法、装置、介质、设备、系统及车辆在审
申请号: | 202011451314.5 | 申请日: | 2020-12-09 |
公开(公告)号: | CN112614490A | 公开(公告)日: | 2021-04-06 |
发明(设计)人: | 王涛 | 申请(专利权)人: | 北京罗克维尔斯科技有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/22 |
代理公司: | 北京英创嘉友知识产权代理事务所(普通合伙) 11447 | 代理人: | 李柯莹 |
地址: | 101300 北京市顺义区高丽营*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 生成 语音 指令 方法 装置 介质 设备 系统 车辆 | ||
1.一种生成语音指令的方法,其特征在于,包括:
接收用户输入的语音音频,并将所述语音音频转换成相应的文本信息;
利用多个语音引擎对所述文本信息进行语音识别,以得到多条语义信息;
从多条所述语义信息中确定目标语义信息;
根据所述目标语义信息生成目标语音指令。
2.根据权利要求1所述的方法,其特征在于,所述语义信息包括领域信息;每一所述语音引擎所属至少一个专用领域;所述从多条所述语义信息中确定目标语义信息,包括:
将属于与所述领域信息表征的领域一致的目标专用领域的语音引擎确定为目标语音引擎;
将所述目标语音引擎输出的语义信息确定为目标语义信息。
3.根据权利要求2所述的方法,其特征在于,至少两个所述语音引擎所属的专用领域包括所述目标专用领域;所述至少两个语音引擎为所述目标语音引擎;
所述将所述目标语音引擎输出的语义信息确定为目标语义信息,包括:
将每一所述目标语音引擎输出的语义信息均确定为目标语义信息。
4.根据权利要求2所述的方法,其特征在于,所述从多条所述语义信息中确定目标语义信息,包括:
在确定多个所述语音引擎各自所属的专用领域均与所述领域信息表征的领域不一致时,将每一所述语音引擎输出的语义信息均作为目标语义信息。
5.根据权利要求2-4中任一项所述的方法,其特征在于,在所述目标语义信息为多个的情况下,所述根据目标语义信息生成目标语音指令,包括:
针对每一所述目标语义信息,根据所述目标语义信息生成候选语音指令,以得到多条所述候选语音指令;
根据预设条件从多条所述候选语音指令中确定出目标语音指令。
6.根据权利要求5所述的方法,其特征在于,所述预设条件包括指定字段的完善度,和/或,操作字段的数量。
7.根据权利要求6所述的方法,其特征在于,所述预设条件包括指定字段的完善度;所述指定字段包括领域字段、意图字段、操作字段中的至少一者。
8.根据权利要求2所述的方法,其特征在于,所述从多条所述语义信息中确定目标语义信息,还包括:
在多条所述语义信息中,将在指定时长内接收到的语义信息确定为候选语义信息;
在所述候选语义信息的数量为一条时,将所述候选语义信息作为目标语义信息。
9.根据权利要求8所述的方法,其特征在于,所述将与所述领域信息表征的领域一致的目标专用领域的语音引擎确定为目标语音引擎,包括:
在所述候选语义信息的数量为多条时,将与所述领域信息表征的领域一致的目标专用领域的语音引擎确定为目标语音引擎。
10.一种生成语音指令的装置,其特征在于,包括:
接收模块,用于接收用户输入的语音音频,并将所述语音音频转换成相应的文本信息;
识别模块,用于利用多个语音引擎对所述文本信息进行语音识别,以得到多条语义信息;
确定模块,用于从多条所述语义信息中确定目标语义信息;
生成模块,用于根据所述目标语义信息生成目标语音指令。
11.根据权利要求10所述的装置,其特征在于,包括:所述语义信息包括领域信息;所述每一所述语音引擎所属至少一个专用领域;所述确定模块包括:
第一确定子模块,用于将属于与所述领域信息表征的领域一致的目标专用领域的语音引擎确定为目标语音引擎;
第二确定子模块,用于将所述目标语音引擎输出的语义信息确定为目标语义信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京罗克维尔斯科技有限公司,未经北京罗克维尔斯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011451314.5/1.html,转载请声明来源钻瓜专利网。