[发明专利]一种声音获取方法、装置、设备及系统有效
申请号: | 201810826055.6 | 申请日: | 2018-07-25 |
公开(公告)号: | CN110767228B | 公开(公告)日: | 2022-06-03 |
发明(设计)人: | 齐昕 | 申请(专利权)人: | 杭州海康威视数字技术股份有限公司 |
主分类号: | G10L15/25 | 分类号: | G10L15/25;G10L15/26;G10L15/30;G10L15/34 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 张聪聪;马敬 |
地址: | 310051 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 声音 获取 方法 装置 设备 系统 | ||
本发明实施例提供了一种声音获取方法、装置、设备及系统,方法包括:先对人员的唇部图像进行分析,在判断人员存在唇部动作的情况下,再获取声音采集设备采集的声音;可以理解,如果人员存在唇部动作,则人员大概率是在开口说话,这种情况下,再获取声音采集设备采集的声音,减少了仅获取到噪声的概率。
技术领域
本发明涉及数据处理技术领域,特别是涉及一种声音获取方法、装置、设备及系统。
背景技术
在智能家居领域、车载设备领域等多种领域中,通常需要进行语音识别,以方便对用户对家居设备、车载设备等进行控制。现有的识别方案一般包括:语音识别设备采集环境中的声音,对采集到的声音进行分析,得到用户发出的控制指令或其他交互信息。
但是上述方案中,语音识别设备并不能区分噪声和用户的语音,如果采集到的声音中仅包括环境中的噪声,语音识别设备也会对噪声进行分析,这样浪费了设备资源。
发明内容
本发明实施例的目的在于提供一种声音获取方法、装置、设备及系统,以减少仅获取到噪声的概率。
为达到上述目的,本发明实施例提供了一种声音获取方法,包括:
获取图像采集设备采集的人员唇部图像;
通过对所述唇部图像进行分析,判断所述人员是否存在唇部动作;
如果存在,则获取声音采集设备在所述人员存在唇部动作后采集的声音。
可选的,所述获取声音采集设备在所述人员存在唇部动作后采集的声音,包括:
确定所述人员相对于声音采集设备的方向;
根据所确定的方向,生成声音采集设备的采集参数;
向所述声音采集设备发送包含所述采集参数的获取指令;
接收所述声音采集设备根据所述获取指令采集的声音。
可选的,在所述获取声音采集设备在所述人员存在唇部动作后采集的声音之后,还包括:
基于所获取的声音及所述唇部图像,执行第一类交互任务。
可选的,在判定所述人员存在唇部动作的情况下,还包括:
对所述唇部图像进行特征提取,得到所述人员的唇语特征;
在所述获取声音采集设备在所述人员存在唇部动作后采集的声音之后,还包括:
对所获取的声音进行特征提取,得到所述人员的声音特征;
所述基于所获取的声音及所述唇部图像,执行第一类交互任务,包括:
将所述唇语特征和所述声音特征输入至预先训练得到的识别网络,基于输出结果执行第一类交互任务。
可选的,所述将所述唇语特征和所述声音特征输入至预先训练得到的识别网络,基于输出结果执行第一类交互任务,包括:
将所述唇语特征和所述声音特征发送至云端服务器,以使所述云端服务器将所述唇语特征和所述声音特征输入至预先训练得到的识别网络,得到输出结果,并获取所述输出结果对应的交互资源;
接收所述云端服务器发送的交互资源;基于所述交互资源执行第一类交互任务。
可选的,在所述获取声音采集设备在所述人员存在唇部动作后采集的声音之后,还包括:
将所获取的声音与预先存储的多个声音模型进行匹配;
执行匹配成功的声音模型对应的第二类交互任务。
为达到上述目的,本发明实施例还提供了一种声音获取装置,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州海康威视数字技术股份有限公司,未经杭州海康威视数字技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810826055.6/2.html,转载请声明来源钻瓜专利网。