[发明专利]语音交互方法及装置有效
申请号: | 201710539227.7 | 申请日: | 2017-07-04 |
公开(公告)号: | CN107316643B | 公开(公告)日: | 2021-08-17 |
发明(设计)人: | 李深安;孔祥星;王兴宝;庄纪军;王雪初;马军涛;韩后岳 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/18;G06F40/30 |
代理公司: | 北京维澳专利代理有限公司 11252 | 代理人: | 赵景平;李轩 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 交互 方法 装置 | ||
本发明公开了一种语音交互方法及装置,该方法包括:在接收语音识别文本之后,将所述语音识别文本分别分发到各业务中,并分别进行语义理解,然后基于得到的语义理解结果、客户端所处应用状态进行置信度排序,获取置信度最高的语义理解结果,对所述置信度最高的语义理解结果做出响应。由于基于多维度的信息进行语义理解结果的置信度排序,不仅考虑了语义理解结果与各业务的匹配度,还同时考虑了客户端所处应用状态,例如是否处于导航状态或听音乐状态,客户端所处应用及应用状态可能就是语音交互所要处理的对象,因此,基于多维度的信息进行语义理解可以有效提升判断其业务所属的准确度,提高对人机交互语义理解的正确率,提升用户体验。
技术领域
本发明涉及语音信号处理领域,具体涉及一种语音交互方法及装置。
背景技术
随着人工智能相关技术的日益成熟,人们的生活开始走向智能化,各种智能设备逐渐进入人们的日常生活中,如智能车机。语音作为智能设备应用中主流的交互方式之一,其方便快捷的优势有目共睹。
在进行语音交互时,用户输入的语音被转写成文本后会经过语义理解,客户端根据语义理解的结果,对相应的事件进行响应。然而,不同于手机等移动终端的近距离语音交互,在智能家居或汽车等应用环境中,用户离麦克风的距离相对较远,加之吵闹环境下的噪音、车载环境下的胎噪、空调噪声、副驾驶和后排乘客的人声干扰等因素,使得环境变得非常复杂。这样即使在用户没有交互意图时,由于噪声的影响,识别和语义产生误触发,给出了语义理解的结果,从而导致客户端做出了对应的响应的情况时有发生。这不仅会给用户带来较差的用户体验,还会由于语义的误触发而影响后续语义理解的正确性,尤其是在考虑历史信息的语音交互过程中。
发明内容
本发明实施例提供一种语音交互方法及装置,避免识别和语义产生误触发,以提高对人机交互语义理解的正确率,提升用户体验。
为此,本发明提供如下技术方案:
一种语音交互方法,所述方法包括:
接收语音识别文本;
将所述语音识别文本分别分发到各业务中,并分别进行语义理解;
基于得到的语义理解结果、客户端所处应用状态进行置信度排序,获取置信度最高的语义理解结果;
对所述置信度最高的语义理解结果做出响应。
优选地,进行语义理解包括:
获取所述语音识别文本中各子片段的语义槽;
将所述语音识别文本中存在语义槽的各子片段替换成对应的语义槽,得到所述语音识别文本的语义匹配路径;
根据预先确定的文法规则对所述语音识别文本进行匹配,得到所述语音识别文本的文本匹配路径。
优选地,所述根据预先确定的文法规则对所述语音识别文本进行匹配,得到所述语音识别文本的文本匹配路径包括:
预先设定表示句首或句尾无意义字符的通配的第一符号、表示句中无意义字符的通配的第二符号和表示有意义字符的完全匹配的第三符号;
将所述语音识别文本的各子片段与当前业务所支持的句式进行匹配,确定各子片段对应的符号,该符号为第一符号、第二符号或第三符号中的一种;
将所述语音识别文本的各子片段替换为对应的符号,得到所述语音识别文本的文本匹配路。
优选地,所述基于得到的语义理解结果、客户端所处应用状态进行置信度排序包括:
预先构建排序模型,所述排序模型的输入包括:文本的词向量、语义匹配路径、文本匹配路径,以及客户端所处应用状态,所述排序模型的输出为输入的文本属于各业务的概率;
基于所述排序模型得到所述语音识别文本属于各业务的概率;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710539227.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种频率分频控制系统及控制方法
- 下一篇:用于信息交互的方法及装置