[发明专利]基于语音识别的业务场景语音人机交互方法及其系统在审

申请号：	201811341744.4	申请日：	2018-11-12
公开（公告）号：	CN109473100A	公开（公告）日：	2019-03-15
发明（设计）人：	雷云红	申请（专利权）人：	四川驹马科技有限公司
主分类号：	G10L15/22	分类号：	G10L15/22;G10L15/26
代理公司：	成都环泰知识产权代理事务所(特殊普通合伙) 51242	代理人：	李斌;黄青
地址：	610000 四川省成都市锦江区***	国省代码：	四川;51
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音识别业务场景语音目标词汇人机交互文本文字用户意图锁定人机交互系统语义解析模块语音识别模块服务场景驾驶安全接收用户语义解析语音控制语音命令语音指令保证场景混乱冲突
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种基于语音识别的业务场景语音人机交互方法，接收用户输入的语音指令，进行语音识别；待识别出文本文字后，根据该文本文字进行语义解析，识别用户意图及目标词汇；根据识别出的用户意图和目标词汇，锁定服务场景。本发明还公开了一种基于语音识别的业务场景语音人机交互系统，包括语音识别模块、语义解析模块和场景锁定模块。本发明保证了语音控制的顺序，保证了特定语音命令组的连续达成和准确执行，避免识别冲突，造成语音混乱，导致定位错误，同时保证了车辆的驾驶安全。

技术领域

本发明涉及语音识别技术领域，具体涉及一种基于语音识别的业务场景语音人机交互方法及其系统。

背景技术

随着移动互联网和车联网的迅猛发展，现在与车相关的移动应用越来越多，比如客运，货运现在也越来越依赖于移动互联设备。

而从车辆驾驶安全角度来说，司机在车上不应该进行不安全的移动设备手势操作，由此我们需要另外一种更加便捷和安全的人机交互方式，语音可以看成是其中一种。

得益于当前语音与语义识别的快速发展，我们可以使用类似于科大讯飞或者百度语音进行大部分常用语义解析。然而在一些特定业务场景中，传统的语义解析基本是不能成功的，这是因为特定场景中的命令词比较生僻，不能使用常规语义解析解析出意图。并且，通常人机交互都由开始，确认，下一步直至完成等等的过程，而语音输入又有很大的复杂性，同一时间可能接收到不同的语音输入，如果我们对不同的语音命令不进行控制，这种情况就会造成很难完成特定的场景控制，我们举例说明这种语音控制场景:

1)司机需要导航到天安门，语音输入“我要到天安门”

2)百度或科大讯飞解析出意图为“要到”，目的地为“天安门”

3)根据意图和目的地解析出应该启动导航应用，并且规划出去天安门的路线图，可能有若干条

4)接着场景的理想输入应该是“第三条”，“选择第三条”，如果用户输入第三条，则整个导航动作可以顺利往下直至完成；但是如果不小心说了“打电话”三个字，则语音会去启动拨号app，造成使用混乱。

发明内容

基于此，针对上述问题，有必要提出一种保证语音控制的顺序，保证特定语音命令组的连续达成和准确执行的基于语音识别的业务场景语音人机交互方法及其系统。

本发明提供一种基于语音识别的业务场景语音人机交互方法，其技术方案如下：

一种基于语音识别的业务场景语音人机交互方法，包括以下步骤：

a、接收用户输入的语音指令，进行语音识别；

b、待识别出文本文字后，根据该文本文字进行语义解析，识别用户意图及目标词汇；

c、根据识别出的用户意图和目标词汇，锁定服务场景。

在本技术方案中，通过语音输入模块，负责将语音翻译为文本，并解析语义，识别出用户意图及目标词汇，然后根据意图与目标词汇寻找路由启动相应第三方应用，并锁定服务场景，锁定服务场景，后续语音输入形成的命令与当前场景不符合，则不予处理；使后续的语音输入与之前的语音输入在同一类型范围内，避免识别冲突，造成语音混乱，导致定位错误。

优选的，所述步骤c包括以下步骤：

根据所定义的常用语音服务场景类型，接收第三方应用传递的场景类型，锁定服务场景。除通过接收用户意图和目标词汇锁定场景外，还可选择常用的语音服务场景类型进行场景锁定，更方便、直观、高效；避免仅靠语音而对场景的定义出现错误。

优选的，还包括以下步骤：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于四川驹马科技有限公司，未经四川驹马科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201811341744.4/2.html，转载请声明来源钻瓜专利网。

上一篇：一种办公室环境智能检测语音控制方法
下一篇：一种差异化随机问答的语音芯片结构和方法

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于语音识别的业务场景语音人机交互方法及其系统在审

专利文献下载