[发明专利]一种提取方法及装置在审
申请号: | 201810529764.8 | 申请日: | 2018-08-07 |
公开(公告)号: | CN108806711A | 公开(公告)日: | 2018-11-13 |
发明(设计)人: | 吴思 | 申请(专利权)人: | 吴思 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216;G10L21/0232;G10L21/0264;G10L21/028;G10L21/0308 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 510655 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标声音 两路 声源 目标声源 频率信号 声音类型 定位目标 多路 终端 | ||
本发明实施例提供了一种提取方法、装置及终端,其中的方法可包括:获取至少两路声音信号,并计算至少两路声音信号的频率信号;根据至少两路声音信号的频率信号,确定至少一个特定声源方向;进一步的,获取该至少一个特定声源方向上的特定声音,并判断特定声音的声音类型;根据特定声音类型,确定目标声源方向和带噪目标声音;最后在目标声源方向上,从带噪目标声音中提取纯净目标声音,从而可以实现从多路声音信号中定位目标声源方向,并准确提取目标声音信号。
技术领域
本申请涉及计算机领域,尤其涉及一种提取方法及装置。
背景技术
在声音信号处理技术中,声源定位方法是一项重要技术,使用此技术的终端结合阵列相关方法能够提取特定方向的声音。但是,常规的声音提取方法是根据信号强度提取,当说话人声音信噪比较小的时候,往往会发生声源方向判断错误以及目标声源识别错误的问题。因此,在阵列通信方法和阵列语音识别方法中,提供一种有效解决声源提取方法是目前需要解决的关键问题。
发明内容
本申请实施例提供了一种提取方法、装置及终端,可以实现从多路声音信号中定位目标声源方向,并准确提取目标声音。
本申请实施例第一方面提供了一种提取方法,包括:
获取至少两路声音信号,并分别计算至少两路声音信号中每路声音信号的的频率信号,得到至少两个频率信号;
根据至少两个频率信号,确定至少一个特定声源方向;
获取至少一个特定声源方向上的特定声音,并判断特定声音的声音类型。
根据特定声音类型,确定目标声源方向和带噪目标声音;
在目标声源方向上,从带噪目标声音中提取纯净目标声音。
可选的,根据至少两个频率信号,确定至少一个特定声源方向,包括:
分别获取至少两个频率信号中每个频率信号在预设频率范围内的子带频率信号;
根据至少两个频率信号中每个频率信号的子带频率信号,确定每两个不同频率信号对应的子带频率信号之间的互相关相位差函数GCC-PHAT;
利用相位差函数,结合麦克风阵型,确定相位差函数平均相位能量和相位差函数峰值,峰值数量为至少一个;
根据平均相位能量和相位差函数峰值,计算各个峰值对应的方向上存在声音的概率;
将各个所述峰值对应的方向上存在声音的概率中大于预设声源输出阈值的存在声音的概率对应的方向确定为特定声源方向,特定声源方向为至少一个。
可选的,获取至少一个特定声源方向上的特定声音,包括:
根据至少一个特定声源方向,构建空间滤波器;
根据空间滤波器对至少一个特定声源方向上的声源滤波,获取至少一个特定声源方向上的声音信号,声音信号为至少一个;
根据声音信号,确定至少一个特定声源方向上的特定声音。
可选的,根据声音信号,确定至少一个特定声源方向上的特定声音,包括:
获取声音信号的快包络能量和慢包络能量;
根据快包络能量和慢包络能量,计算各个声音信号中存在声音的概率;
将所述存在声音的概率中大于预设存在声音阈值的存在声音的概率对应的声音信号确定为声音信号对应的特定声源方向上的特定声音。
可选的,判断特定声音的声音类型,包括:
利用第一编码算法和第二编码算法计算特定声音的第一编码误差和第二编码误差;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吴思,未经吴思许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810529764.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种语音增强增益调整方法、系统及耳机
- 下一篇:减少频域处理量的方法与装置