[发明专利]一种基于非接触式的语音交互方法及系统和设备在审
申请号: | 202010221110.6 | 申请日: | 2020-03-26 |
公开(公告)号: | CN111445910A | 公开(公告)日: | 2020-07-24 |
发明(设计)人: | 李仁芳 | 申请(专利权)人: | 杭州涂鸦信息技术有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/05;G10L21/02;G10L25/78 |
代理公司: | 北京崇智专利代理事务所(普通合伙) 11605 | 代理人: | 任小燕 |
地址: | 310013 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 接触 语音 交互 方法 系统 设备 | ||
本发明涉及一种基于非接触式的语音交互方法,包括以下步骤:接收来自非接触式设备采集的非接触式交互数据;根据预设阈值判断所述非接触式交互数据是否发生中断事件;若发生中断事件,根据预设判别算法判断所述中断事件为误触发或非误触发;若为非误触发,根据VAD算法在所述非接触式交互数据中提取语音数据;根据预设解析算法对所述语音数据进行解析,得到控制意图;根据所述控制意图输出相应的控制指令。通过本发明的技术方案,能够简化现有的非接触式交互方法、化繁为简,且成本低。
技术领域
本发明涉及语音处理技术领域,尤其涉及一种基于非接触式的语音交互方法及其系统、计算机可读存储介质和计算机设备。
背景技术
目前主要的做法包括以下两种:
1)本地VAD配合本地或者云端ASR。通过前端阵列mic,进行降噪空间滤波之后得到较为干净的语音信号,送给后端做识别。
2)push-to-talk模式,就是类似语音遥控器,按住说话,然后结束之后将语音上传云端ASR进行识别和解析。
发明内容
本发明旨在至少解决现有技术或相关技术中存在的技术问题之一。
为此,本发明的目的在于提供一种基于非接触式的语音交互方法及其系统、计算机可读存储介质和计算机设备,其能够简化现有的非接触式交互方法、化繁为简,且成本低。
为实现上述目的,本发明第一方面的技术方案提供了一种基于非接触式的语音交互方法,包括以下步骤:
接收来自非接触式设备采集的非接触式交互数据;
根据预设阈值判断所述非接触式交互数据是否发生中断事件;
若发生中断事件,根据预设判别算法判断所述中断事件为误触发或非误触发;
若为非误触发,根据VAD算法在所述非接触式交互数据中提取语音数据;
根据预设解析算法对所述语音数据进行解析,得到控制意图;
根据所述控制意图输出相应的控制指令。
在上述技术方案中,优选地,在接收来自非接触式设备采集的非接触式交互数据之前,还包括以下步骤:
初始化所述非接触式设备;
根据所述非接触式设备的采集方式配置触发阈值;
根据所述触发阈值判断所述非接触式设备采集的数据是否为非接触式交互数据。
本发明第二方面的技术方案提供了一种基于非接触式的语音交互系统,包括:
数据接收模块,被设置为用于接收来自非接触式设备采集的非接触式交互数据;
中断事件判断模块,被设置为用于根据预设阈值判断所述非接触式交互数据是否发生中断事件;
误触发判断模块,被设置为用于根据预设判别算法判断所述中断事件为误触发或非误触发;
VAD语音提取模块,被设置为用于根据VAD算法在所述非接触式交互数据中提取语音数据;
意图解析模块,被设置为用于根据预设解析算法对所述语音数据进行解析,得到控制意图;
控制模块,被设置为用于根据所述控制意图输出相应的控制指令。
在上述技术方案中,优选地,还包括:
初始化模块,被设置为用于初始化所述非接触式设备;
阈值配置模块,被设置为用于根据所述非接触式设备的采集方式配置触发阈值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州涂鸦信息技术有限公司,未经杭州涂鸦信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010221110.6/2.html,转载请声明来源钻瓜专利网。