[发明专利]基于TOPK多路音源有效信号筛选系统及方法在审
申请号: | 202011372222.8 | 申请日: | 2020-11-30 |
公开(公告)号: | CN112562718A | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 陶亚雄;王彬 | 申请(专利权)人: | 重庆电子工程职业学院 |
主分类号: | G10L21/0272 | 分类号: | G10L21/0272;G10L17/00;G10L25/78 |
代理公司: | 重庆强大凯创专利代理事务所(普通合伙) 50217 | 代理人: | 隋金艳 |
地址: | 401331 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 topk 音源 有效 信号 筛选 系统 方法 | ||
1.基于TOPK多路音源有效信号筛选系统,其特征在于,包括:
输入单元,用于输入N路语音与N路背景声音所形成的混音;
预判单元,用于采用VAD算法对各路语音逐个进行预判:若语音正常,VAD值为1;若语音输出状态不确定,VAD值为0;若语音无输出,VAD值为—1;
分级单元,用于对VAD值为1的语音,采用AMDF算法将语音信号依次分为1~10级,并进行赋值;
筛选单元,用于接收N路语音信号,按设定的缓存量对各时刻的N路缓存信号,筛选出M路最强信号;
纠错单元,用于利用信号相关性,采用FEC算法补齐筛选出的M路最强信号因时延导致丢失的前端语音信号;
输出模块,用于输出补齐后的M路最强信号。
2.如权利要求1所述的基于TOPK多路音源有效信号筛选系统,其特征在于,纠错单元还用于对M路最强信号逐个进行声纹识别,保留与预设声纹特征符合的最强信号,删除与预设声纹特征不符合的最强信号。
3.如权利要求2所述的基于TOPK多路音源有效信号筛选系统,其特征在于,纠错单元还用于对M路最强信号逐个进行小波分解,得到小波信号序列,并根据小波信号序列得到有效语音信号。
4.如权利要求3所述的基于TOPK多路音源有效信号筛选系统,其特征在于,根据小波信号序列中所有样点的音频强度值中的最大值和最小值确定音频强度阈值,将小波信号序列中音频强度值大于音频强度阈值的样点在M路最强信号中对应样点的信号确定为有效语音信号。
5.如权利要求4所述的基于TOPK多路音源有效信号筛选系统,其特征在于,纠错单元还用于对M路最强信号进行前期处理,包括预加重处理,加窗处理和端点检测。
6.基于TOPK多路音源有效信号筛选方法,其特征在于,包括步骤:
S1、输入N路语音与N路背景声音所形成的混音;
S2、采用VAD算法对各路语音逐个进行预判:若语音正常,VAD值为1;若语音输出状态不确定,VAD值为0;若语音无输出,VAD值为—1;
S3、对VAD值为1的语音,采用AMDF算法将语音信号依次分为1~10级,并进行赋值;
S4、接收N路语音信号,按设定的缓存量对各时刻的N路缓存信号,筛选出M路最强信号;
S5、利用信号相关性,采用FEC算法补齐筛选出的M路最强信号因时延导致丢失的前端语音信号;
S6、输出补齐后的M路最强信号。
7.如权利要求6所述的基于TOPK多路音源有效信号筛选方法,其特征在于,S5中,还对M路最强信号逐个进行声纹识别,保留与预设声纹特征符合的最强信号,删除与预设声纹特征不符合的最强信号。
8.如权利要求7所述的基于TOPK多路音源有效信号筛选方法,其特征在于,S5中,还对M路最强信号逐个进行小波分解,得到小波信号序列,并根据小波信号序列得到有效语音信号。
9.如权利要求8所述的基于TOPK多路音源有效信号筛选方法,其特征在于,根据小波信号序列中所有样点的音频强度值中的最大值和最小值确定音频强度阈值,将小波信号序列中音频强度值大于音频强度阈值的样点在M路最强信号中对应样点的信号确定为有效语音信号。
10.如权利要求9所述的基于TOPK多路音源有效信号筛选方法,其特征在于,S5中,还对M路最强信号进行前期处理,包括预加重处理,加窗处理和端点检测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆电子工程职业学院,未经重庆电子工程职业学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011372222.8/1.html,转载请声明来源钻瓜专利网。