[发明专利]基于声学相机的音频视觉场景分析有效
申请号: | 201680011015.5 | 申请日: | 2016-02-18 |
公开(公告)号: | CN107223332B | 公开(公告)日: | 2021-02-05 |
发明(设计)人: | N.卡希尔;H.M.卡尔;M.Y.凯利;K.诺兰;A.V.拉扎鲁特;K.A.埃利斯;R.J.奥`马利 | 申请(专利权)人: | 英特尔公司 |
主分类号: | H04N5/225 | 分类号: | H04N5/225;H04N5/232;H04N7/18;H04R1/02 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 张凌苗;郑冀之 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 公开了用于场景分析的技术,其包括使用声学成像和计算机音频视觉(CAV)过程用于监视应用。在一些实施例中,用麦克风阵列、图像传感器、声学图像控制器和控制器来利用声学图像设备。在一些情况下,控制器至少分析声学图像数据内的空间谱的部分以通过标识具有超过特定阈值的强度的像素的区域来检测声音变化。另外,控制器可以基于具有超过阈值的强度的像素之间的相对距离来检测两个或更多个共现的声音事件。可以使用计算机音频视觉、声音/语音识别和声学签名技术来分析图像像素数据、音频样本数据和声学图像数据的得到的数据融合,以识别/标识与事件相关联的音频和视觉特征并且凭经验或理论上确定引起每个事件的一个或多个状况。 | ||
搜索关键词: | 基于 声学 相机 音频 视觉 场景 分析 | ||
【主权项】:
一种声学监视系统,其包括:麦克风设备阵列;声学图像控制器,其通信地耦合到麦克风设备阵列并且被配置成基于从麦克风设备阵列接收的多个音频信号而输出声学图像数据;以及计算机音频视觉(CAV)控制器,其通信地耦合到声学图像控制器并且包括事件识别模式,所述事件识别模式被配置成至少分析声学图像数据的部分以检测所观察的场景内的一个或多个声音事件,并且确定引起所述一个或多个声音事件的至少一个状况。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201680011015.5/,转载请声明来源钻瓜专利网。