[发明专利]语音控制方法及装置在审
申请号: | 201811543052.8 | 申请日: | 2018-12-17 |
公开(公告)号: | CN111326152A | 公开(公告)日: | 2020-06-23 |
发明(设计)人: | 张文涛;乔慧丽 | 申请(专利权)人: | 南京人工智能高等研究院有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/25;G10L15/26 |
代理公司: | 北京布瑞知识产权代理有限公司 11505 | 代理人: | 孟潭 |
地址: | 210038 江苏省南京市南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 控制 方法 装置 | ||
本申请公开了一种语音控制方法及装置,该语音控制方法包括:获取用户的语音特征数据,并获取与所述语音特征数据对应的唇部特征数据;基于所述语音特征数据和所述唇部特征数据确定控制终端的控制词;控制所述终端执行与所述控制词相对应的操作。本申请的技术方案在噪声大、光线暗、以及声音能量小等多种情况下可提高用户语音被采集时的准确率,进而提高语音识别的准确率,从而提高用户体验,增强了人机交互的自然性。
技术领域
本发明涉及语音识别领域,具体涉及一种语音控制方法及装置。
背景技术
随着人们对人机交互要求的提高,越来越多的设备应用到语音识别技术。现有的语音交互方式大多采用语音来唤醒设备或控制设备执行与语音相对应的指令,这种交互方式适应性差,例如在声音嘈杂的环境中,语音识别的准确率低、设备响应效果不好,造成用户体验差。
因此,亟待提供一种准确率高的语音控制方法及装置。
发明内容
为了解决上述技术问题,本申请的实施例提供了一种语音控制方法及装置。
根据本申请的一个方面,提供了一种语音控制方法,包括:获取用户的语音特征数据,并获取与语音特征数据对应的唇部特征数据;基于语音特征数据和唇部特征数据确定控制终端的控制词;控制终端执行与控制词相对应的操作。
根据本申请的另一个方面,提供了一种语音控制装置,包括:获取模块,用于获取用户的语音特征数据,并获取与语音特征数据对应的唇部特征数据;确定模块,用于基于语音特征数据和唇部特征数据确定控制终端的控制词;控制模块,用于控制终端执行与控制词相对应的操作。
根据本申请的又一个方面,提供了一种计算机可读存储介质,存储介质存储有计算机程序,计算机程序用于执行上述的语音控制方法。
根据本申请的又一个方面,提供了一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器,其中,处理器用于执行上述的语音控制方法。
本申请实施例提供了一种语音控制方法及装置,通过融合语音特征数据和唇部特征数据来识别用户语音中的控制词,在噪声大、光线暗、以及声音能量小等多种情况下可提高用户语音被采集时的准确率,进而提高语音识别的准确率,从而提高用户体验,增强了人机交互的自然性。
附图说明
通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1A是本申请一示例性实施例提供的语音控制系统的系统架构示意图。
图1B是本申请一示例性实施例提供的语音控制方法的流程示意图。
图2是本申请另一示例性实施例提供的语音控制方法的流程示意图。
图3是本申请另一示例性实施例提供的语音控制方法的流程示意图。
图4是本申请另一示例性实施例提供的语音控制方法的流程示意图。
图5是本申请另一示例性实施例提供的语音控制方法的流程示意图。
图6是本申请一示例性实施例提供的语音控制装置的结构示意图。
图7是本申请另一示例性实施例提供的语音控制装置的结构示意图。
图8是本申请一示例性实施例提供的电子设备的框图。
图9是本申请一示例性实施例提供的唇部图像。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京人工智能高等研究院有限公司,未经南京人工智能高等研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811543052.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种防外漏低温阀门
- 下一篇:电视终端旋转控制的方法、装置及计算机存储介质