[发明专利]利用深度学习和有限数据进行多阵列声音应用的特征处理在审
申请号: | 202010783855.1 | 申请日: | 2020-08-06 |
公开(公告)号: | CN112560885A | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | G·J·V·M·勒穆安;P·维纳亚维金;D·J·R·阿格拉万特;井上忠宣;A·穆纳沃 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/00;G06N3/04;G01S5/18 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 马明月 |
地址: | 美国纽*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本公开的实施例涉及利用深度学习和有限数据进行多阵列声音应用的特征处理。本公开提供了一种用于多源声音定位的计算机实现的方法。方法包括:由硬件处理器从被包括在两个或更多个麦克风阵列中的每个麦克风阵列中的相应多个麦克风提取频谱特征。方法还包括:由硬件处理器通过重新布置和复制来自被包括在两个或更多个麦克风阵列中的每个麦克风阵列中的相应多个麦克风的频谱特征,形成来自被包括在两个或更多个麦克风阵列中的每个麦克风阵列内的相应多个麦克风的频谱特征的对的相应集合。方法还包括:由硬件处理器将频谱特征的对的相应集合输入到神经网络中,以将频谱特征编码成深度特征,并对深度特征进行解码,以从神经网络输出一个或多个声音源的至少一个位置表示。 | ||
搜索关键词: | 利用 深度 学习 有限 数据 进行 阵列 声音 应用 特征 处理 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010783855.1/,转载请声明来源钻瓜专利网。
- 上一篇:诊断装置与方法以及计算机可读取存储媒介
- 下一篇:分析文本数据的语气