[发明专利]一种语音信息的处理方法、装置、设备及介质在审
申请号: | 201910990447.0 | 申请日: | 2019-10-17 |
公开(公告)号: | CN112687274A | 公开(公告)日: | 2021-04-20 |
发明(设计)人: | 吴本谷;何梦中 | 申请(专利权)人: | 北京猎户星空科技有限公司 |
主分类号: | G10L17/00 | 分类号: | G10L17/00;G10L17/04;G10L17/14;G10L17/26 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 冉玲芬 |
地址: | 100025 北京市朝*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 信息 处理 方法 装置 设备 介质 | ||
本发明公开了一种语音信息的处理方法、装置、设备及介质,用以提高电子设备在复杂场景中对人声语音信息进行识别的工作效率。由于本发明实施例通过预先训练完成的模型,获取采集到的语音信息的第一声纹特征,若获取的语音信息生成的第一声纹特征与保存的非人声语音信息对应的第二声纹特征的相似度均小于设定阈值,则对该语音信息进行语音识别处理,从而使得电子设备只对人声语音信息进行语音识别处理,有效地提高了电子设备的处理效率。
技术领域
本发明涉及语音识别技术领域,尤其涉及一种语音信息的处理方法、装置、设备及介质。
背景技术
随着应用于智能交互设备的科学技术的迅猛发展,智能设备已经拥有了强大的处理能力,可以实现在一定程度上像人类一样理解自然语言。
作为智能设备代表的机器人,当机器人采集了语音信息后,可以基于机器人采集到的语音信息,进行语音识别处理,从而使机器人输出相应的回复信息。
然而在现有技术中,机器人一般会应用于公共场所,但由于公共场所具有人流密集等特点,机器人的工作环境非常复杂,因此机器人在复杂场景下采集语音信息时,机器人除了能够采集到人发出的语音信息,也会采集到自身输出的合成语音信息、机器人所在环境中的其它设备输出的合成语音信息等各种非人声语音信息,当这些非人声语音信息被机器人采集到后,因为无法进行区分,现有技术中也会对这些非人声语音信息进行语音识别处理。这不仅浪费了大量的资源,并且还会影响对真正需要语音识别处理的人声语音信息的正常处理,从而影响了对正常的人声语音信息的处理效率。
此外,对于免唤醒机器人来说,由于免唤醒机器人是持续不断的采集语音信息的,因此上述问题更为严重。
发明内容
本发明实施例提供了一种语音信息的处理方法、装置、设备及介质,用以提高电子设备对人声语音信息的处理效率。
本发明实施例提供了一种语音信息的处理方法,所述方法包括:
获取采集到的语音信息;
通过预先训练完成的声纹模型,获取所述语音信息对应的第一声纹特征;
若所述第一声纹特征与保存的每个第二声纹特征的相似度均小于设定阈值,则对所述语音信息进行语音识别处理,其中所述第二声纹特征为非人声语音信息的声纹特征。
在一种可能的实施方式中,所述第二声纹特征为根据所述预先训练完成的声纹模型,获取的所述非人声语音信息的声纹特征确定的。
在一种可能的实施方式中,所述非人声语音信息为采集所述语音信息的智能设备输出的合成语音信息,和/或所述智能设备所在环境中的其它设备输出的合成语音信息。
在一种可能的实施方式中,所述声纹模型通过如下方式训练:
获取样本集中的任一人声语音样本,所述样本集中的人声语音样本包括第一人声语音样本,及分别对所述第一人声语音样本加噪处理后生成的第二人声语音样本;
根据所述人声语音样本及所述人声语音样本对应的标签信息,对原始声纹模型进行训练。
在一种可能的实施方式中,所述方法还包括:
若所述第一声纹特征与任一所述第二声纹特征的相似度不小于设定阈值,则过滤所述语音信息。
在一种可能的实施方式中,通过如下方式确定所述第二声纹特征:
根据至少两个非人声语音信息,确定所述第二声纹特征,其中,所述至少两个非人声语音信息属于相同类别或不同类别。
在一种可能的实施方式中,根据至少两个非人声语音信息,确定所述第二声纹特征,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京猎户星空科技有限公司,未经北京猎户星空科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910990447.0/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置