[发明专利]一种语音特征处理方法、装置、电子设备及存储介质有效
申请号: | 202110290322.4 | 申请日: | 2021-03-18 |
公开(公告)号: | CN112735397B | 公开(公告)日: | 2021-07-23 |
发明(设计)人: | 谷悦;杨嵩;王莎 | 申请(专利权)人: | 北京世纪好未来教育科技有限公司 |
主分类号: | G10L15/20 | 分类号: | G10L15/20;G10L21/0208 |
代理公司: | 上海知锦知识产权代理事务所(特殊普通合伙) 31327 | 代理人: | 王立娜 |
地址: | 100144 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 特征 处理 方法 装置 电子设备 存储 介质 | ||
本申请实施例提供一种语音特征处理方法、装置、电子设备及存储介质,其中方法包括:从带噪语音的语音特征中去除噪音的语音特征,得到纯净语音特征估计;对所述纯净语音特征估计进行编码处理,得到第一语音特征编码信息,以及对所述带噪语音的语音特征进行编码处理,得到第二语音特征编码信息;根据所述第一语音特征编码信息以及所述第二语音特征编码信息,得到用于解码的目标语音特征编码信息。本申请实施例可针对带噪语音,准确的形成语音特征编码信息,为提升语音识别的准确性提供基础。
技术领域
本申请实施例涉及语音识别技术领域,具体涉及一种语音特征处理方法、装置、电子设备及存储介质。
背景技术
语音识别是一种将语音转换为文本的技术,其在人机的语音交互、智能控制、通讯等场景下具有广泛应用,因此提升语音识别的准确性具有重要意义。
在进行语音识别时,需要对待识别语音对应的语音特征进行编码处理,形成深层的语音特征编码信息,进而对语音特征编码信息进行解码等进一步处理,实现文本转换;然而在语音识别的实际应用场景中,待识别语音除了说话者本身的纯净语音外还可能存在噪音,即待识别语音为带噪语音,这使得从带噪语音中提取的语音特征存在噪音的语音特征,导致后续处理形成的语音特征编码信息也相应存在噪音的编码信息,极大的影响了语音识别的准确性,降低了语音识别服务的用户体验;
因此,针对待识别的带噪语音,如何提供语音特征处理方案,以准确的形成语音特征编码信息,为提升语音识别的准确性提供基础,成为了本领域技术人员亟需解决的问题。
发明内容
有鉴于此,本申请实施例提供一种语音特征处理方法、装置、电子设备及存储介质,以针对带噪语音,准确的形成语音特征编码信息,为提升语音识别的准确性提供基础。
为实现上述目的,本申请实施例提供如下技术方案:
一种语音特征处理方法,包括:
从带噪语音的语音特征中去除噪音的语音特征,得到纯净语音特征估计;
对所述纯净语音特征估计进行编码处理,得到第一语音特征编码信息,以及对所述带噪语音的语音特征进行编码处理,得到第二语音特征编码信息;
根据所述第一语音特征编码信息以及所述第二语音特征编码信息,得到用于解码的目标语音特征编码信息。
本申请实施例还提供一种语音特征处理装置,包括:
噪音去除模块,用于从带噪语音的语音特征中去除噪音的语音特征,得到纯净语音特征估计;
编码处理模块,用于对所述纯净语音特征估计进行编码处理,得到第一语音特征编码信息,以及对所述带噪语音的语音特征进行编码处理,得到第二语音特征编码信息;
目标编码信息得到模块,用于根据所述第一语音特征编码信息以及所述第二语音特征编码信息,得到用于解码的目标语音特征编码信息。
本申请实施例还提供一种电子设备,包括至少一个存储器和至少一个处理器,所述存储器存储一条或多条计算机可执行指令,所述处理器调用所述一条或多条计算机可执行指令,以执行实现如上述所述的语音特征处理方法。
本申请实施例还提供一种存储介质,所述存储介质存储一条或多条计算机可执行指令,所述一条或多条计算机可执行指令被执行时实现如上述所述的语音特征处理方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京世纪好未来教育科技有限公司,未经北京世纪好未来教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110290322.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种鬼臼毒素在烟草抑芽中的应用
- 下一篇:燃气灶自动定时熄火装置及保护方法