[发明专利]一种语音处理方法、装置及电子设备在审
申请号: | 201910624795.6 | 申请日: | 2019-07-11 |
公开(公告)号: | CN112216303A | 公开(公告)日: | 2021-01-12 |
发明(设计)人: | 陈孝良;奚少亭;冯大航 | 申请(专利权)人: | 北京声智科技有限公司 |
主分类号: | G10L21/034 | 分类号: | G10L21/034;G10L21/0272;G10L21/0216 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 赵焕 |
地址: | 100080 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 处理 方法 装置 电子设备 | ||
1.一种语音处理方法,其特征在于,包括:
获取分离后的语音;所述语音为n路,n≥2;不同的所述语音的方向不同;
计算每一路所述语音对应的输出功率;
依据每一路所述语音对应的输出功率,消除每一路所述语音中非所述语音部分,得到修正后的语音。
2.根据权利要求1所述的语音处理方法,其特征在于,所述计算每一路所述语音对应的输出功率,包括:
计算每一路所述语音中的每一帧子语音对应的输出功率;所述每一帧所述子语音对应的输出功率的计算公式为:
其中,Y为采样点数;xi为对所述子语音采样的每一个采样点对应的音频数据。
3.根据权利要求2所述的语音处理方法,其特征在于,所述语音包括两路语音;
所述依据每一路所述语音对应的输出功率,消除每一路所述语音中非所述语音部分,得到修正后的语音,包括:
选取两路所述语音中的一路语音作为目标语音,另一路所述语音作为非目标语音;
对于所述目标语音中的每一帧目标子语音对应的输出功率,若所述输出功率大于所述非目标语音中相应帧对应的输出功率,将所述非目标语音中相应帧的振幅缩小为预设数值;
若所述输出功率不大于所述非目标语音中相应帧对应的输出功率,将所述目标语音中所述目标子语音的振幅缩小为预设数值;
所述目标子语音为所述目标语音中的每一帧子语音。
4.根据权利要求1所述的语音处理方法,其特征在于,在所述获取分离后的语音之前,还包括:
获取混合语音;
对所述混合语音进行语音分离,得到分离后的所述语音。
5.一种语音处理装置,其特征在于,包括:
语音获取模块,用于获取分离后的语音;所述语音为n路,n≥2;不同的所述语音的方向不同;
功率计算模块,用于计算每一路所述语音对应的输出功率;
语音修正模块,用于依据每一路所述语音对应的输出功率,消除每一路所述语音中非所述语音部分,得到修正后的语音。
6.根据权利要求5所述的语音处理装置,其特征在于,所述功率计算模块用于计算每一路所述语音对应的输出功率时,具体用于:
计算每一路所述语音中的每一帧子语音对应的输出功率;所述每一帧所述子语音对应的输出功率的计算公式为:
其中,Y为采样点数;xi为对所述子语音采样的每一个采样点对应的音频数据。
7.根据权利要求6所述的语音处理装置,其特征在于,所述语音包括两路语音;
相应的,所述语音修正模块包括:
选取子模块,用于选取两路所述语音中的一路语音作为目标语音,另一路所述语音作为非目标语音;
第一处理子模块,用于对于所述目标语音中的每一帧目标子语音对应的输出功率,若所述输出功率大于所述非目标语音中相应帧对应的输出功率,将所述非目标语音中相应帧的振幅缩小为预设数值;
第二处理子模块,用于若所述输出功率不大于所述非目标语音中相应帧对应的输出功率,将所述目标语音中所述目标子语音的振幅缩小为预设数值;
所述目标子语音为所述目标语音中的每一帧子语音。
8.根据权利要求5所述的语音处理装置,其特征在于,还包括:
数据获取模块,用于获取混合语音;
语音分离模块,用于对所述混合语音进行语音分离,得到分离后的所述语音。
9.一种电子设备,其特征在于,包括:存储器和处理器;
其中,所述存储器用于存储程序;
处理器调用程序并用于:
获取分离后的语音;所述语音为n路,n≥2;不同的所述语音的方向不同;
计算每一路所述语音对应的输出功率;
依据每一路所述语音对应的输出功率,消除每一路所述语音中非所述语音部分,得到修正后的语音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京声智科技有限公司,未经北京声智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910624795.6/1.html,转载请声明来源钻瓜专利网。