[发明专利]用于自主驾驶应用的应急响应车辆检测在审
申请号: | 202111384092.4 | 申请日: | 2021-11-15 |
公开(公告)号: | CN114550736A | 公开(公告)日: | 2022-05-27 |
发明(设计)人: | A·当特莱;A·托拉比;A·杰恩;R·加纳帕蒂;A·帕泰特;R·R·纳拉;N·阿瓦达汗纳姆 | 申请(专利权)人: | 辉达公司 |
主分类号: | G10L21/02 | 分类号: | G10L21/02;G10L21/0208;G10L25/30;G10L25/51;G10L19/02;G08B21/18;G06K9/62;G06N3/04;G06N3/08;B60R11/02 |
代理公司: | 北京市磐华律师事务所 11336 | 代理人: | 赵楠 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 自主 驾驶 应用 应急 响应 车辆 检测 | ||
1.一种方法,包括:
接收使用自主或半自主机器的多个麦克风生成的音频数据;
至少部分地基于所述音频数据,执行声学三角测量算法以确定应急响应车辆的位置或所述应急响应车辆的行进方向中的至少一个;
至少部分地基于所述音频数据,生成与来自所述音频数据的一个或更多个音频信号相对应的一个或更多个频率的频谱的表示;
将表示所述表示的第一数据应用到神经网络;
使用所述神经网络且至少部分地基于所述第一数据计算表示至少第一警示类型和第二警示类型的概率的第二数据;
至少部分地基于所述概率确定所述应急响应车辆的类型;以及
由所述自主或半自主机器,至少部分地基于所述应急响应车辆的所述类型以及所述应急响应车辆的所述位置或所述应急响应车辆的所述行进方向中的一个或更多个,执行一个或更多个操作。
2.根据权利要求1所述的方法,其中一个或更多个频率的频谱的表示包括Mel谱图。
3.根据权利要求1所述的方法,其中所述神经网络包括卷积递归神经网络(CRNN)。
4.根据权利要求1所述的方法,其中所述警示与以下至少一个相对应:
告警;
一个或更多个告警的序列或模式;
警报;
一个或更多个警报的序列或模式;
来自车辆喇叭的一种或更多种发射;或者
来自至少一个车辆喇叭的发射的序列或模式。
5.根据权利要求1所述的方法,其中所述多个麦克风设置在所述自主或半自主机器的多个麦克风阵列内,所述多个麦克风阵列中的每个麦克风阵列包括多个麦克风。
6.根据权利要求5所述的方法,其中所述多个麦克风阵列包括设置在所述自主或半自主机器的前部的第一麦克风阵列、设置在所述自主或半自主机器的后部的第二麦克风阵列、设置在所述自主或半自主机器的左部的第三麦克风阵列、设置在所述自主或半自主机器的右部的第四麦克风阵列或者设置在所述自主或半自主机器的顶部的第五麦克风阵列中的两个或更多个。
7.根据权利要求5所述的方法,其中所述多个麦克风阵列中的每个麦克风阵列包括设置于其上的风挡。
8.根据权利要求1所述的方法,进一步包括:
从所述音频数据中过滤掉背景噪声以生成经处理的音频数据,
其中执行所述声学三角测量算法或者生成所述表示中的至少一个至少部分地基于所述经处理的音频数据。
9.根据权利要求1所述的方法,其中过滤掉所述背景噪声包括执行波束形成算法。
10.根据权利要求1是的方法,其中计算所述第二数据包括:
使用所述神经网络的一个或更多个门控线性单元(GLU)处理表示所述表示的所述第一数据;以及
使用一个或更多个门控递归单元(GRU)处理第三数据,所述第三数据至少部分地基于所述一个或更多个GLU的输出而生成。
11.根据权利要求10所述的方法,其中将注意力应用到至少部分地基于GRU的输出而生成的第四数据。
12.根据权利要求11所述的方法,其中由一个或更多个致密层使用softmax函数或sigmoid函数中的至少一个应用所述注意力。
13.根据权利要求1所述的方法,其中使用记录的音频数据和增强的音频数据训练所述神经网络,所述增强的音频数据使用所述记录的音频数据以及增强技术中的一种或更多种生成,所述一种或更多种增强技术包括时间拉伸、时间移位、音高移位、动态范围压缩和不同信噪比(SNR)下的噪声增强中的至少一个。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辉达公司,未经辉达公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111384092.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种显影盒
- 下一篇:使用基于语义的数据链接增强隐私数据集的方法和系统