[发明专利]结合图像识别和语音定位的麦克风跟踪系统及方法在审
申请号: | 202010718515.0 | 申请日: | 2020-07-23 |
公开(公告)号: | CN111932619A | 公开(公告)日: | 2020-11-13 |
发明(设计)人: | 虞焰兴 | 申请(专利权)人: | 安徽声讯信息技术有限公司 |
主分类号: | G06T7/73 | 分类号: | G06T7/73;G06K9/00;H04R1/32 |
代理公司: | 上海精晟知识产权代理有限公司 31253 | 代理人: | 李佼佼 |
地址: | 230000 安徽省合肥市合肥*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 结合 图像 识别 语音 定位 麦克风 跟踪 系统 方法 | ||
1.一种结合图像识别和语音定位的麦克风跟踪系统,包括摄像头、麦克风和后台服务器,其特征在于:
所述摄像头用于采集当前场景的图像序列,并将采集的图像序列发送至后台服务器进行处理;
所述麦克风包括声音采集模块和声音处理模块;所述声音采集模块用于当前现场场景的声音采集;所述声音处理模块用于根据当前麦克风处于的近场场景或远场场景进行声音的减弱或增强处理;
所述后台服务器包括图像识别单元和麦克风跟踪单元;所述图像识别单元用于识别图像序列中人员嘴部位置和麦克风位置,以麦克风作为三维坐标的原点,根据空间滤波算法计算麦克风与嘴部之间距离,利用预先设置好的距离阀值,判断当前场景处于近场场景还是远场场景;所述麦克风跟踪模块用于根据计算麦克风与嘴部之间距离调节麦克风的距离和仰角。
2.根据权利要求1所述的一种结合图像识别和语音定位的麦克风跟踪系统,其特征在于,所述摄像头位置和麦克风位置统一三维坐标。
3.根据权利要求1所述的一种结合图像识别和语音定位的麦克风跟踪系统,其特征在于,所述图像识别单元计算出人嘴到麦克风距离后判断出当前处于的场景以及定位出嘴与麦克风的方向,并反馈至麦克风的声音处理单元;所述声音处理单元对定位方向的声音信号进行加强并同时对其他方向的声音信号进行抑制。
4.根据权利要求1所述的一种结合图像识别和语音定位的麦克风跟踪系统,其特征在于,所述麦克风为一组双麦克风阵列;所述麦克风固定在讲桌正前方;所述摄像头为一组摄像头,其中一摄像头位于麦克风正上方,另一摄像头固定在讲桌一侧且与麦克风高度相同。
5.一种结合图像识别和语音定位的麦克风跟踪方法,其特征在于,包括如下步骤:
步骤S1:采集当前场景图像序列;
步骤S2:识别图像序列中的人脸以及麦克风,并缓存识别出以麦克风为原点的三维坐标;
步骤S3:根据空间滤波算法计算麦克风与嘴部之间距离和角度;
步骤S4:利用预先设置好的距离阀值,判断当前场景处于近场场景还是远场场景;
步骤S5:麦克风跟踪模块调节麦克风与人嘴之间的距离和仰角;
步骤S6:根据当前场景是近场场景还是远场场景,麦克风处理模块对声音的减弱或增强处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽声讯信息技术有限公司,未经安徽声讯信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010718515.0/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序