[发明专利]基于语音识别的业务场景语音人机交互方法及其系统在审
申请号: | 201811341744.4 | 申请日: | 2018-11-12 |
公开(公告)号: | CN109473100A | 公开(公告)日: | 2019-03-15 |
发明(设计)人: | 雷云红 | 申请(专利权)人: | 四川驹马科技有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26 |
代理公司: | 成都环泰知识产权代理事务所(特殊普通合伙) 51242 | 代理人: | 李斌;黄青 |
地址: | 610000 四川省成都市锦江区*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音识别 业务场景 语音 目标词汇 人机交互 文本文字 用户意图 锁定 人机交互系统 语义解析模块 语音识别模块 服务场景 驾驶安全 接收用户 语义解析 语音控制 语音命令 语音指令 保证 场景 混乱 冲突 | ||
本发明公开了一种基于语音识别的业务场景语音人机交互方法,接收用户输入的语音指令,进行语音识别;待识别出文本文字后,根据该文本文字进行语义解析,识别用户意图及目标词汇;根据识别出的用户意图和目标词汇,锁定服务场景。本发明还公开了一种基于语音识别的业务场景语音人机交互系统,包括语音识别模块、语义解析模块和场景锁定模块。本发明保证了语音控制的顺序,保证了特定语音命令组的连续达成和准确执行,避免识别冲突,造成语音混乱,导致定位错误,同时保证了车辆的驾驶安全。
技术领域
本发明涉及语音识别技术领域,具体涉及一种基于语音识别的业务场景语音人机交互方法及其系统。
背景技术
随着移动互联网和车联网的迅猛发展,现在与车相关的移动应用越来越多,比如客运,货运现在也越来越依赖于移动互联设备。
而从车辆驾驶安全角度来说,司机在车上不应该进行不安全的移动设备手势操作,由此我们需要另外一种更加便捷和安全的人机交互方式,语音可以看成是其中一种。
得益于当前语音与语义识别的快速发展,我们可以使用类似于科大讯飞或者百度语音进行大部分常用语义解析。然而在一些特定业务场景中,传统的语义解析基本是不能成功的,这是因为特定场景中的命令词比较生僻,不能使用常规语义解析解析出意图。并且,通常人机交互都由开始,确认,下一步直至完成等等的过程,而语音输入又有很大的复杂性,同一时间可能接收到不同的语音输入,如果我们对不同的语音命令不进行控制,这种情况就会造成很难完成特定的场景控制,我们举例说明这种语音控制场景:
1)司机需要导航到天安门,语音输入“我要到天安门”
2)百度或科大讯飞解析出意图为“要到”,目的地为“天安门”
3)根据意图和目的地解析出应该启动导航应用,并且规划出去天安门的路线图,可能有若干条
4)接着场景的理想输入应该是“第三条”,“选择第三条”,如果用户输入第三条,则整个导航动作可以顺利往下直至完成;但是如果不小心说了“打电话”三个字,则语音会去启动拨号app,造成使用混乱。
发明内容
基于此,针对上述问题,有必要提出一种保证语音控制的顺序,保证特定语音命令组的连续达成和准确执行的基于语音识别的业务场景语音人机交互方法及其系统。
本发明提供一种基于语音识别的业务场景语音人机交互方法,其技术方案如下:
一种基于语音识别的业务场景语音人机交互方法,包括以下步骤:
a、接收用户输入的语音指令,进行语音识别;
b、待识别出文本文字后,根据该文本文字进行语义解析,识别用户意图及目标词汇;
c、根据识别出的用户意图和目标词汇,锁定服务场景。
在本技术方案中,通过语音输入模块,负责将语音翻译为文本,并解析语义,识别出用户意图及目标词汇,然后根据意图与目标词汇寻找路由启动相应第三方应用,并锁定服务场景,锁定服务场景,后续语音输入形成的命令与当前场景不符合,则不予处理;使后续的语音输入与之前的语音输入在同一类型范围内,避免识别冲突,造成语音混乱,导致定位错误。
优选的,所述步骤c包括以下步骤:
根据所定义的常用语音服务场景类型,接收第三方应用传递的场景类型,锁定服务场景。除通过接收用户意图和目标词汇锁定场景外,还可选择常用的语音服务场景类型进行场景锁定,更方便、直观、高效;避免仅靠语音而对场景的定义出现错误。
优选的,还包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川驹马科技有限公司,未经四川驹马科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811341744.4/2.html,转载请声明来源钻瓜专利网。