[发明专利]一种语音过滤方法和过滤系统在审
申请号: | 202011557341.0 | 申请日: | 2020-12-25 |
公开(公告)号: | CN112687275A | 公开(公告)日: | 2021-04-20 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 北京中科深智科技有限公司 |
主分类号: | G10L17/00 | 分类号: | G10L17/00;G10L17/18;G10L25/24;G10L21/0272 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100000 北京市丰台区航*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种语音过滤方法和过滤系统,其中方法包括:给定目标说话者的参考音频,并将参考音频输入到声纹识别网络,输出目标说话者的声纹特征;将带多人对话的噪声音频转换为噪声幅度谱;将声纹特征和噪声幅度谱输入到声音过滤网络中,生成一谱掩码;将谱掩码和噪声幅度谱相乘以生成一增强幅度谱;将噪声音频的相位增加到增强幅度谱上,然后将增强幅度谱转换为增强音频,增强音频为从噪声音频中过滤得到的具有目标说话者的声纹特征的说话音频。本发明只需要给定目标说话者的参考音频,即可从带噪声的多人对话音频中识别并过滤出某个目标说话者的声音,不需要大量的音频特征匹配过程,识别速度和准确度得到了大幅提升。 | ||
搜索关键词: | 一种 语音 过滤 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中科深智科技有限公司,未经北京中科深智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202011557341.0/,转载请声明来源钻瓜专利网。
- 上一篇:模块化封装结构及方法
- 下一篇:一种农业灌溉渠道水量计量保证满管的结构