[发明专利]一种语音处理方法、装置及电子设备在审
申请号: | 201910624795.6 | 申请日: | 2019-07-11 |
公开(公告)号: | CN112216303A | 公开(公告)日: | 2021-01-12 |
发明(设计)人: | 陈孝良;奚少亭;冯大航 | 申请(专利权)人: | 北京声智科技有限公司 |
主分类号: | G10L21/034 | 分类号: | G10L21/034;G10L21/0272;G10L21/0216 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 赵焕 |
地址: | 100080 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 处理 方法 装置 电子设备 | ||
本发明提供了一种语音处理方法、装置及电子设备,获取分离后的语音,计算每一路所述语音对应的输出功率,依据每一路所述语音对应的输出功率,消除每一路所述语音中非所述语音部分,得到修正后的语音。通过本发明,在采用波束成形算法BF进行语音分离得到分离后的语音之后,依据每一语音对应的输出功率来消除语音中的干扰,使得最终得到的修正后的语音中干扰量更小。
技术领域
本发明涉及语音分离领域,更具体的说,涉及一种语音处理方法、装置及电子设备。
背景技术
随着时代的发展,人工智能AI技术日新月异,也逐渐走入了人们的生活。在很多场景都需要将语音对话记录下来,利用波束成形算法BF进行语音分离,并将分离后的语音发送至语音识别引擎进行语音识别,但是分离后的语音仍然存在很多残留的干扰。
发明内容
有鉴于此,本发明提供一种语音处理方法、装置及电子设备,以解决利用波束成形算法BF分离得到的语音仍然存在很多残留的干扰的问题。
为解决上述技术问题,本发明采用了如下技术方案:
一种语音处理方法,包括:
获取分离后的语音;所述语音为n路,n≥2;不同的所述语音的方向不同;
计算每一路所述语音对应的输出功率;
依据每一路所述语音对应的输出功率,消除每一路所述语音中非所述语音部分,得到修正后的语音。
优选地,所述计算每一路所述语音对应的输出功率,包括:
计算每一路所述语音中的每一帧子语音对应的输出功率;所述每一帧所述子语音对应的输出功率的计算公式为:
其中,Y为采样点数;xi为对所述子语音采样的每一个采样点对应的音频数据。
优选地,所述语音包括两路语音;
所述依据每一路所述语音对应的输出功率,消除每一路所述语音中非所述语音部分,得到修正后的语音,包括:
选取两路所述语音中的一路语音作为目标语音,另一路所述语音作为非目标语音;
对于所述目标语音中的每一帧目标子语音对应的输出功率,若所述输出功率大于所述非目标语音中相应帧对应的输出功率,将所述非目标语音中相应帧的振幅缩小为预设数值;
若所述输出功率不大于所述非目标语音中相应帧对应的输出功率,将所述目标语音中所述目标子语音的振幅缩小为预设数值;
所述目标子语音为所述目标语音中的每一帧子语音。
优选地,在所述获取分离后的语音之前,还包括:
获取混合语音;
对所述混合语音进行语音分离,得到分离后的所述语音。
一种语音处理装置,包括:
语音获取模块,用于获取分离后的语音;所述语音为n路,n≥2;不同的所述语音的方向不同;
功率计算模块,用于计算每一路所述语音对应的输出功率;
语音修正模块,用于依据每一路所述语音对应的输出功率,消除每一路所述语音中非所述语音部分,得到修正后的语音。
优选地,所述功率计算模块用于计算每一路所述语音对应的输出功率时,具体用于:
计算每一路所述语音中的每一帧子语音对应的输出功率;所述每一帧所述子语音对应的输出功率的计算公式为:
其中,Y为采样点数;xi为对所述子语音采样的每一个采样点对应的音频数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京声智科技有限公司,未经北京声智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910624795.6/2.html,转载请声明来源钻瓜专利网。