[发明专利]多音源的噪声处理方法在审
申请号: | 202111654359.7 | 申请日: | 2021-12-30 |
公开(公告)号: | CN114613377A | 公开(公告)日: | 2022-06-10 |
发明(设计)人: | 麦联韬;唐海江;朱宇;袁宇豪 | 申请(专利权)人: | 杭州云嘉云计算有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L15/20;G10L25/30;G10L25/45 |
代理公司: | 杭州杭诚专利事务所有限公司 33109 | 代理人: | 尉伟敏 |
地址: | 311100 浙江省杭州市余*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多音 噪声 处理 方法 | ||
1.多音源的噪声处理方法,其特征在于,包括以下步骤:
S1:采集实时采音设备的各通道语音信号;
S2:对通道语音进行特征分析和挖掘;
S3:排除采集环境噪音的麦克风通道;
S4:消除串音通道中串音音源;
S5:将正常音源送入语音识别系统进行识别。
2.根据权利要求1所述的多音源的噪声处理方法,其特征在于,所述S1存在n个采音设备,在第t时间帧的语音信号有4000个,则输出的数据是4000n的矩阵,某采音设备该时间帧采集到的数字信号
3.根据权利要求2所述的多音源的噪声处理方法,其特征在于,所述S2数字信号划分为200窗口大小,20窗口总数,维度为20×200的窗口数据,表达为512长度的矢量在对所有通道进行如上操作后,输出维度为512n的特征数据。
4.根据权利要求3所述的多音源的噪声处理方法,其特征在于,所述S3获取原始数字信号,分别建立功率指标判定。对某通道的声学数字信号,计算其功率对特征数据经过分类模型,输出其为噪音音源的概率若或超过阈值,无需进入后续分析步骤。
5.根据权利要求4所述的多音源的噪声处理方法,其特征在于,所述S4对各通道的特征数据进行相似度计算,对相似度高的通道,再通过马尔可夫过程进行数字信号的时序对齐,识别出在时间上有向后延迟的相似通道,并判定其为串音通道,存在n个通道的特征数据对两两相似度计算,输出相似度最高的三个通道u,v,w和相似度su,v、su,w和sv,w,对u,v,w通道的原始采集到的声学数字信号进行时序对齐,判断串音通道和出现串音的概率,取每个通道在当前时间的特征数据和历史时间帧上的特征数据进行异常检测。
6.根据权利要求5所述的多音源的噪声处理方法,其特征在于,所述S5将正常音源送入语音识别系统进行识别,并将对应结果输出到其对应的角色通道进行显示。
7.根据权利要求5所述的多音源的噪声处理方法,其特征在于,所述判断串音通道的过程为:计算相似通道对之间相似的部分发生的时间段,并取概率最大的对齐路径,例如对齐后v通道和w通道均延后于u通道,v通道和w通道则是相对于u通道的串音通道。
8.根据权利要求5所述的多音源的噪声处理方法,其特征在于,所述串音的概率计算方法为:某通道在该时间桢上的特征数据取K桢历史特征数据对该K+1帧的特征进行时序上的前馈记忆网络建模并输出建模结果串音的概率。
9.根据权利要求6所述的多音源的噪声处理方法,其特征在于,非正常音源包括环境噪声音源和串音音源,且识别结果置空。
10.根据权利要求5所述的多音源的噪声处理方法,其特征在于,所述相似度大于70%。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州云嘉云计算有限公司,未经杭州云嘉云计算有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111654359.7/1.html,转载请声明来源钻瓜专利网。