[发明专利]一种视频通信中的音频智能降噪的处理系统有效
申请号: | 202110063901.5 | 申请日: | 2021-01-18 |
公开(公告)号: | CN112911198B | 公开(公告)日: | 2023-04-14 |
发明(设计)人: | 请求不公布姓名 | 申请(专利权)人: | 广州佰锐网络科技有限公司 |
主分类号: | H04N7/15 | 分类号: | H04N7/15;G10L21/0208 |
代理公司: | 广州博联知识产权代理有限公司 44663 | 代理人: | 宋佳 |
地址: | 510665 广东省广州市天河*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 通信 中的 音频 智能 处理 系统 | ||
1.一种视频通信中的音频处理系统,其特征在于,包括:包括远端服务器、视频采集客户端设备;
所述视频采集客户端设备能够通过网络与所述远端服务器相连,用以将采集到的视频传递至云端服务器;
所述云端服务器内设中控分析模块,用以分析带有音频的视频并获取音频位置信息;
当采用一种视频通信中的音频处理系统时,所述中控分析模块提取发言的通信视频内人体轮廓,当在通信视频只提取到一位人体轮廓时,中控分析模块判定该人体轮廓为发言人,中控分析模块采集发言人音频信息生成音频矩阵F1(F11,F12,F13,F14,F15),其中,F11为音频矩阵F1直达声信息,F12为音频矩阵F1反射声信息,F13为音频矩阵F1声音的高频衰减量比,F14为音频矩阵F1混响声信息,F15为音频矩阵F1声响强度;
所述中控分析模块计算声音清晰度g并对清晰度g进行调节,g=F15÷(F11×f11+F12×f12+F13×f13+F14×f14),其中,f11为F11对清晰度g的补偿参数,f12为F12对清晰度g的补偿参数,f13为F13对清晰度g的补偿参数,f14为F14对清晰度g的补偿参数;
所述中控分析模块内设有背景识别矩阵A0、视频纵深距离矩阵B0、背景对音频补偿参数矩阵C0和视频纵深距离补偿参数矩阵D0,所述背景对音频补偿参数矩阵C0中包括若干背景对音频补偿参数,所述视频纵深距离补偿参数矩阵D0中包括若干视频纵深距离补偿参数;
当采用所述视频通信中的音频处理系统时,用户通过所述视频采集客户端将通讯视频上传至所述远端服务器,所述中控分析模块对提取待识别视频中的背景信息A并将A与矩阵A0内参数作对比,以确定背景对音频补偿参数;中控分析模块判断视频纵深距离B并将B与B0内参数作对比以选取视频纵深距离补偿参数;根据背景对音频补偿参数和视频纵深距离补偿参数所述中控分析模块计算音频分析纵深补偿参数E;
所述中控分析模块内设有视频通信发言人距离矩阵W0和声响补偿参数矩阵Y0;所述声响补偿参数矩阵Y0中包含若干声响补偿参数;中控分析模块通过人体轮廓大小判断发言人与视频采集客户端距离W并将W和矩阵W0内参数做对比以选取声响补偿参数,根据声响补偿参数与音频分析纵深补偿参数E中控分析模块对音频矩阵F1声响强度F15进行补偿;
当在通信视频中提取到多个人体轮廓时,所述中控分析模块提取视频中所有音频并对音频进行提取,生成音频矩阵组F0(F1,F2,F3,…Fn),其中,F1为视频中第一条音频矩阵,F2为视频中第二条音频矩阵,F3为视频中第三条音频矩阵,…Fn为视频中第n条音频矩阵;中控分析模块选取矩阵组F0中最为平稳连续的音频矩阵Fk为发言人音频矩阵,对于视频中第k条音频矩阵Fk,k=1,2,3…n;中控分析模块通过直达声信息Fk1、反射声信息Fk2和音频分析纵深补偿参数E计算发言人距离范围以确定发言人并对音频矩阵Fk进行降噪和调节声响强度;
所述中控分析模块中还设有音频清晰度参数矩阵G0和声音降噪参数矩阵H0,对于音频清晰度参数矩阵G0,G0(G1,G2,G3,G4),其中,G1为第一预设音频清晰度参数,G2为第二预设音频清晰度参数,G3为第三预设音频清晰度参数,G4为第四预设音频清晰度参数,各所述清晰度参数按照顺序依次增大;
对于声音降噪参数矩阵H0,H0(H1,H2,H3,H4),其中,H1为第一预设声音降噪参数,H2为第二预设声音降噪参数,H3为第三预设声音降噪参数,H4为第四预设声音降噪参数,各所述声音降噪参数按照顺序依次减小;
中控分析模块计算音频矩阵F1的清晰度g并将g与矩阵G0内参数作对比:
当g<G1时,中控分析模块判定音频矩阵F1清晰度不合格并从矩阵H0中选取H1作为声音降噪参数;
当G1≤g<G2时,中控分析模块判定音频矩阵F1清晰度不合格并从矩阵H0中选取H2作为声音降噪参数;
当G2≤g<G3时,中控分析模块判定音频矩阵F1清晰度不合格并从矩阵H0中选取H3作为声音降噪参数;
当G3≤g<G4时,中控分析模块判定音频矩阵F1清晰度不合格并从矩阵H0中选取H4作为声音降噪参数;
当g≥G4时,中控分析模块判定音频矩阵F1清晰度合格;
当中控分析模块判定音频F1清晰度不合格时,中控分析模块对音频矩阵F1进行降噪,降噪后音频矩阵为F1’(F11’,F12’,F13’,F14’,F15),其中,F11’=F11×f1×(G4-g)×Hp,p=1,2,3,4, f1为F11’ 降噪补偿参数;F12’=F12×f2×(G4-g)×Hp,f2为F12’ 降噪补偿参数;F13’=F13×f3×(G4-g)×Hp,f3为F13’降噪补偿参数;F14’=F14×f4×(G4-g)×Hp, f4为F14’ 降噪补偿参数;
所述中控分析模块检测音频矩阵F1’清晰度g’并将g’与矩阵G0内参数作对比,当g’≥G4时,中控分析模块判定音频矩阵F1’清晰度合格;当g’<G4时,重复上述操作,直至g’≥G4。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州佰锐网络科技有限公司,未经广州佰锐网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110063901.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种永久抗菌面料的制备方法
- 下一篇:一种用于煤炭燃烧后煤渣的粉碎装置