[发明专利]一种远场语音模拟方法及装置有效

申请号：	201910954666.3	申请日：	2019-10-09
公开（公告）号：	CN112634877B	公开（公告）日：	2022-09-23
发明（设计）人：	焦伟;冯大航;陈孝良;常乐	申请（专利权）人：	北京声智科技有限公司
主分类号：	G10L15/06	分类号：	G10L15/06;G10L25/30
代理公司：	北京银龙知识产权代理有限公司 11243	代理人：	许静;黄灿
地址：	100098 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种语音模拟方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供一种远场语音模拟方法及装置，该方法包括：获取近场语音数据和目标位置信息；将所述近场语音数据和目标位置信息输入至模拟远场语音神经网络模型进行模拟，以得到与所述目标位置信息对应的远场语音数据；其中，所述模拟远场语音神经网络模型使用的训练样本包括：近场语音样本数据、远场语音样本数据、录制位置信息和噪声数据。本发明实施例能够提高模拟出的远场语音数据的真实性。

技术领域

本发明涉及语音处理技术领域，尤其涉及一种远场语音模拟方法及装置。

背景技术

目前，语音识别系统越来越广泛被应用于车载系统、智能手表、智能手机等领域，且随着智能音箱的兴起，远场语音识别技术得到很大的关注，现有的语音识别系统中，一般使用模拟远场语音来训练对齐模型，再使用对齐模型对数据进行对齐，来训练声学模型。

远场语音数据和近场语音数据的区别主要体现在混响和噪音两个方面，现有技术中，通常是通过将近场语音和冲激响应做卷积操作来模仿混响效果，将噪声和近场语音相加来模仿噪音效果，但由于该方式较为简单，混响和噪音的样本丰富度较低，导致模拟出的远场语音不够真实，与真实远场语音存在较大差别。

发明内容

本发明实施例提供一种远场语音模拟方法及装置，以解决现有远场语音模拟方法模拟出的远场语音不够真实、与真实远场语音存在较大差别的问题。

为解决上述技术问题，本发明是这样实现的：

第一方面，本发明实施例提供了一种远场语音模拟方法，包括：

获取近场语音数据和目标位置信息；

将所述近场语音数据和目标位置信息输入至模拟远场语音神经网络模型进行模拟，以得到与所述目标位置信息对应的远场语音数据；

其中，所述模拟远场语音神经网络模型使用的训练样本包括：近场语音样本数据、远场语音样本数据、录制位置信息和噪声数据。