[发明专利]一种语音信号增强方法和装置以及设备在审
申请号: | 202010360697.9 | 申请日: | 2020-04-30 |
公开(公告)号: | CN111583946A | 公开(公告)日: | 2020-08-25 |
发明(设计)人: | 肖龙源;李稀敏;叶志坚;刘晓葳 | 申请(专利权)人: | 厦门快商通科技股份有限公司 |
主分类号: | G10L21/02 | 分类号: | G10L21/02;G10L21/0208;G10L15/26 |
代理公司: | 厦门原创专利事务所(普通合伙) 35101 | 代理人: | 黄一敏 |
地址: | 361000 福建省厦门市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 信号 增强 方法 装置 以及 设备 | ||
1.一种语音信号增强方法,其特征在于,包括:
获取语音信号和对应所述语音信号的地理位置信息;
根据所述地理位置信息,对所述语音信号对应的语音现场匹配环境场景类型;
根据所述环境场景类型,消除所述语音信号中的环境噪声;
从所述消除环境噪声后的语音信号中识别出所需的语音数据;
增强所述识别出的语音数据。
2.如权利要求1所述的语音信号增强方法,其特征在于,所述根据所述地理位置信息,对所述语音信号对应的语音现场匹配环境场景类型,包括:
根据所述地理位置信息,获得对应所述地理位置信息的街景图像,根据所述街景图像,对所述语音信号对应的语音现场匹配环境场景类型。
3.如权利要求1所述的语音信号增强方法,其特征在于,所述根据所述环境场景类型,消除所述语音信号中的环境噪声,包括:
根据所述环境场景类型,从预设的环境噪声消声模型数据库中调取对应所述环境场景类型的环境噪声消声模型,根据所述调取的环境噪声消声模型,消除所述语音信号中的环境噪声。
4.如权利要求1所述的语音信号增强方法,其特征在于,所述从所述消除环境噪声后的语音信号中识别出所需的语音数据,包括:
采用基于所述语音信号的声纹特征和所需的语音数据的声纹特征,通过将所述语音信号中涵盖所述所需的语音数据的声纹特征最多且时间长度最短的语音数据作为目标语音数据的方式,从所述语音信号中识别出与所需的语音对应的语音数据。
5.如权利要求1所述的语音信号增强方法,其特征在于,在所述增强所述识别出的语音数据之后,还包括:
通过长短期记忆网络和交叉熵损失的损失函数采用预设次数的迭代方式,对所述增强后的语音数据进行优化。
6.一种语音信号增强装置,其特征在于,包括:
获取模块、匹配模块、消除模块、识别模块和增强模块;
所述获取模块,用于获取语音信号和对应所述语音信号的地理位置信息;
所述匹配模块,用于根据所述地理位置信息,对所述语音信号对应的语音现场匹配环境场景类型;
所述消除模块,用于根据所述环境场景类型,消除所述语音信号中的环境噪声;
所述识别模块,用于从所述消除环境噪声后的语音信号中识别出所需的语音数据;
所述增强模块,用于增强所述识别出的语音数据。
7.如权利要求6所述的语音信号增强装置,其特征在于,所述匹配模块,具体用于:
根据所述地理位置信息,获得对应所述地理位置信息的街景图像,根据所述街景图像,对所述语音信号对应的语音现场匹配环境场景类型。
8.如权利要求6所述的语音信号增强装置,其特征在于,所述消除模块,具体用于:
根据所述环境场景类型,从预设的环境噪声消声模型数据库中调取对应所述环境场景类型的环境噪声消声模型,根据所述调取的环境噪声消声模型,消除所述语音信号中的环境噪声。
9.如权利要求6所述的语音信号增强装置,其特征在于,所述识别模块,具体用于:
采用基于所述语音信号的声纹特征和所需的语音数据的声纹特征,通过将所述语音信号中涵盖所述所需的语音数据的声纹特征最多且时间长度最短的语音数据作为目标语音数据的方式,从所述语音信号中识别出与所需的语音对应的语音数据。
10.如权利要求6所述的语音信号增强装置,其特征在于,所述语音信号增强装置,还包括:
优化模块;
所述优化模块,用于通过长短期记忆网络和交叉熵损失的损失函数采用预设次数的迭代方式,对所述增强后的语音数据进行优化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门快商通科技股份有限公司,未经厦门快商通科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010360697.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种英文翻译练习装置
- 下一篇:基于语音识别的远程门禁系统及其授权方法