[发明专利]对周围声音中的音频信号的标识以及响应于该标识的对自主交通工具的引导在审
申请号: | 201811208638.9 | 申请日: | 2018-10-17 |
公开(公告)号: | CN109803207A | 公开(公告)日: | 2019-05-24 |
发明(设计)人: | S·阿科特卡;M·拉姆泰克;T·伯克莱特;S·森达拉姆 | 申请(专利权)人: | 英特尔公司 |
主分类号: | H04R3/00 | 分类号: | H04R3/00;G06N3/04;G06N3/08 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 高见;张欣 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频信号 周围声音 驾驶 音频分析单元 计算机辅助 麦克风 交通工具 神经网络 音频特征 响应 接收音频信号 紧急警报信号 响应音频信号 驾驶系统 驱动系统 捕捉 概率 | ||
1.一种计算机辅助或自主驾驶CA/AD装置,用于标识被包括在邻近于半自主或自主驾驶SA/AD交通工具的周围声音中的音频信号,所述CA/AD驾驶装置包括:
通信接口,所述通信接口用于从耦合至所述SA/AD交通工具的多个麦克风接收音频信号;
音频分析单元,所述音频分析单元被耦合以从所述通信接口接收所述音频信号,并且用于:
将所述音频信号划分成多个帧;以及
从所述多个帧中的一个或多个帧提取音频特征;以及
神经网络分类器,所述神经网络分类器被耦合以从所述音频分析单元接收所提取特征并且生成所述多个帧中的一个或多个帧的概率得分来对所述多个帧中的一个或多个帧进行分类,以允许对所述音频信号的标识。
2.如权利要求1所述的CA/AD驾驶装置,其特征在于,进一步包括多个麦克风,并且包括设置在所述SA/AD交通工具外部之中、之上、周围或邻近处的一个或多个麦克风。
3.如权利要求1所述的CA/AD驾驶装置,其特征在于,所述神经网络分类器包括先前用多个音频输入样本训练的深度神经网络DNN,所述多个音频输入样本包括以下中的至少一者:警报声音、脉冲声音、动物声音、家庭背景声音、婴儿和儿童声音、成人声音、媒体声音,所述媒体声音包括语音、电视、无线电等。
4.如权利要求1所述的CA/AD驾驶装置,其特征在于,所述概率得分用于指示所述多个帧中的一个或多个包括警报帧还是非警报帧,并且其中所述CA/AD驾驶装置进一步包括机载计算机,所述机载计算机用于接收所述概率得分以及用于确定所述音频信号是否与紧急交通工具相关联。
5.如权利要求1所述的CA/AD驾驶装置,其特征在于,所述音频分析单元用于提取包括多个mel频率倒谱系数MFCC帧向量的音频特征。
6.如权利要求1所述的CA/AD驾驶装置,其特征在于,进一步包括所述多个麦克风,以及与所述多个麦克风集成、耦合至所述多个麦克风、或者以其他方式邻近于所述多个麦克风的本地处理单元,其中所述本地处理单元包括所述音频分析单元和所述神经网络分类器。
7.如权利要求1所述的CA/AD驾驶装置,其特征在于,所述多个麦克风中的一个或多个麦克风用于执行波束成形来在与所述音频信号相关联的方向上操纵音频束。
8.如权利要求1所述的CA/AD驾驶装置,其特征在于,进一步包括耦合至所述SA/AD交通工具的视频处理相机,所述视频处理相机用于从捕捉到与所述音频信号相关联的警报帧的方向捕捉视频。
9.如权利要求1-8中任一项所述的CA/AD驾驶装置,其特征在于,所述CA/AD驾驶装置包括SA/AD交通工具并且其中所述驾驶元件包括以下中的一者或多者:引擎、电马达、制动系统、驾驶系统、轮子、传动装置、以及电池。
10.如权利要求1-8中任一项所述的CA/AD驾驶装置,其特征在于,所述CA/AD驾驶装置包括所述SA/AD交通工具并且进一步包括导航控制模块,所述导航控制模块用于接收紧急交通工具的大致位置,以及用于控制操纵模块,所述操纵模块用于允许与所述音频信号相关联的紧急交通工具经过所述SA/AD交通工具。
11.如权利要求1-8中任一项所述的CA/AD驾驶装置,其特征在于,所述CA/AD驾驶装置包括SA/AD交通工具,并且所述CA/AD驾驶装置响应于对所述音频信号的标识来控制所述SA/AD交通工具的驾驶元件以自主地或半自主地驾驶所述SA/AD交通工具。
12.如权利要求1-8中任一项所述的CA/AD驾驶装置,其特征在于,进一步包括耦合至导航控制模块以辅助引导所述SA/AD交通工具来对与所述音频信号相关联的紧急交通工具的位置作出响应的、基于视觉的相机、雷达、以及光检测和测距LIDAR传感器中的至少一者。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811208638.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种耳机的异形声道物理分频结构
- 下一篇:一种音频文件处理方法及电子装置