[发明专利]基于声学环境评估的语音采集方法、装置、设备和介质有效
申请号: | 202010913557.X | 申请日: | 2020-09-03 |
公开(公告)号: | CN111766303B | 公开(公告)日: | 2020-12-11 |
发明(设计)人: | 谢单辉;张伟彬 | 申请(专利权)人: | 深圳市声扬科技有限公司 |
主分类号: | G01N29/11 | 分类号: | G01N29/11;G01B17/00;G01B17/02;G01S5/18 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 刘佳妮 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 声学环境 评估 语音 采集 方法 装置 设备 介质 | ||
本申请涉及一种基于声学环境评估的语音采集方法、装置、计算机设备和存储介质,通过获取采集室对应的环境图像,检测环境图像得到环境对象和环境对象的材质类型,获取与材质类型匹配的吸音系数和环境对象相对于语音采集装置的距离,根据吸音系数和距离计算得到采集室的各个预设语音采集位置的室内脉冲响应;根据响应时间划分各个室内脉冲响应得到各个预设语音采集位置的语音信号和混响信号,获取采集室的环境噪声信号,根据环境噪声信号、各个预设语音采集位置的语音信号和混响信号对采集室进行声学环境评估,获取与声学环境评估结果匹配的目标采集策略,根据目标采集策略进行语音采集。采用本方法能够提高采集的语音数据的质量。
技术领域
本申请涉及音频处理技术领域,特别是涉及一种基于声学环境评估的语音采集方法、装置、计算机设备和存储介质。
背景技术
语音信号的采集是语音通话、语音识别、声纹识别、声纹鉴定等应用的第一步。一般来说,采集的语音数据质量越高,识别、鉴定等性能也越好。而由于声音信号的物理特性,声学环境是影响采集的语音数据质量的重要因素之一。因此,对采集语音数据时的声学环境进行评估极其重要。
目前,语音采集设备通常采用固定的采集模式来采集语音数据,或者依靠人工对声学环境进行评估后调整语音采集设备的采集模式,然而这要求评估人员需要具备专业的声学环境评估知识,耗费人力。并且,通过人耳判断实际声学环境不够准确,导致采集得到的语音数据的质量较低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高采集的语音数据的质量的基于声学环境评估的语音采集方法、装置、计算机设备和存储介质。
一种基于声学环境评估的语音采集方法,所述方法包括:
获取采集室对应的环境图像,对所述环境图像进行检测,得到环境对象和所述环境对象对应的材质类型;
获取与所述材质类型匹配的吸音系数以及所述环境对象相对于语音采集装置的距离,并根据所述距离确定所述语音采集装置位于所述环境对象中的位置坐标,根据所述吸音系数和所述语音采集装置的位置坐标计算得到所述采集室的各个预设语音采集位置的室内脉冲响应;所述室内脉冲响应携带响应时间;
根据所述响应时间对所述各个预设语音采集位置的室内脉冲响应进行划分,得到各个预设语音采集位置的语音信号和各个预设语音采集位置的混响信号;
获取所述采集室的环境噪声信号,根据所述各个预设语音采集位置的语音信号及所述环境噪声信号进行计算以得到所述各个预设语音采集位置的信噪比,根据所述各个预设语音采集位置的语音信号及所述各个预设语音采集位置的混响信号进行计算以得到所述各个预设语音采集位置的信混比,并根据所述各个预设语音采集位置的信噪比和信混比对所述采集室的声学环境进行评估,得到声学环境评估结果;
获取与所述声学环境评估结果匹配的目标采集策略,根据所述目标采集策略进行语音采集。
在其中一个实施例中,所述对所述环境图像进行检测,得到环境对象和所述环境对象对应的材质类型,包括:
对所述环境图像进行特征提取,得到所述环境图像的形状特征;
根据所述形状特征,从所述环境图像中检测得到环境对象;
从所述环境图像中提取得到所述环境对象的纹理特征;
对所述纹理特征进行分类识别,得到所述环境对象对应的材质类型。
在其中一个实施例中,所述根据所述吸音系数和所述语音采集装置的位置坐标计算得到所述采集室的各个预设语音采集位置的室内脉冲响应,包括:
根据所述吸音系数计算得到与所述材质类型匹配的声音反射系数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市声扬科技有限公司,未经深圳市声扬科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010913557.X/2.html,转载请声明来源钻瓜专利网。