[发明专利]一种车载语音处理方法、装置、设备及存储介质在审
申请号: | 202011057299.6 | 申请日: | 2020-09-29 |
公开(公告)号: | CN114360529A | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 杨晓霞;刘溪 | 申请(专利权)人: | 大众问问(北京)信息科技有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L21/0208;G10L21/0216;G10L21/0272;G10L17/00 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 100098 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 车载 语音 处理 方法 装置 设备 存储 介质 | ||
本发明实施例公开了一种车载语音处理方法、装置、设备及存储介质。该方法包括:获取主副驾驶方向语音,并从主副驾驶方向语音中提取主驾驶方向第一语音和副驾驶方向第一语音;分别对主驾驶方向第一语音和副驾驶方向第一语音进行噪声残余估计,确定第一估计噪声残余和第二估计噪声残余;根据第一估计噪声残余和第二估计噪声残余,分别对主驾驶方向第一语音和副驾驶方向第一语音进行噪声与残余抑制,得到主驾驶方向第二语音和副驾驶方向第二语音。该方法可以对主副驾驶区的语音进行最佳分离,避免主对副或者副对主的干扰,以提供精准主、副驾驶区的语音,便于精准识别语音并提供精准服务。
技术领域
本发明实施例涉及语音处理技术领域,尤其涉及一种车载语音处理方法、装置、设备及存储介质。
背景技术
随着通信技术与科技技术的发展,车载环境中的语音交互系统越来越受到重视。在车载环境中,通过语音交互系统可以满足驾驶员的应用需求,如查询天气、导航或者调节空调温度等。语音交互系统可以避免驾驶员分心,提高驾驶员驾驶时的注意力。
但是,在车载环境中,经常存在主副驾驶员同时说话的场景。将主副驾驶员的语音作为整体进行语音识别,无法准确识别主驾驶员或者副驾驶员的语音,会存在副驾驶员或者主驾驶员的声音残余,存在语音干扰,无法提供精准服务,用户体验差。
发明内容
本发明实施例提供了一种车载语音处理方法、装置、设备及存储介质,可以对主副驾驶区的语音进行最佳分离,避免主对副或者副对主的干扰,以提供精准主、副驾驶区的语音。
第一方面,本发明实施例提供了一种车载语音处理方法,该方法包括:
获取主副驾驶方向语音,并从所述主副驾驶方向语音中提取主驾驶方向第一语音和副驾驶方向第一语音;
分别对所述主驾驶方向第一语音和所述副驾驶方向第一语音进行噪声残余估计,确定第一估计噪声残余和第二估计噪声残余;
根据所述第一估计噪声残余和所述第二估计噪声残余,分别对所述主驾驶方向第一语音和所述副驾驶方向第一语音进行噪声与残余抑制,得到主驾驶方向第二语音和副驾驶方向第二语音。
第二方面,本发明实施例还提供了一种车载语音处理装置,该装置包括:
语音获取模块,用于获取主副驾驶方向语音,并从所述主副驾驶方向语音中提取主驾驶方向第一语音和副驾驶方向第一语音;
噪声残余估计模块,用于分别对所述主驾驶方向第一语音和所述副驾驶方向第一语音进行噪声残余估计,确定第一估计噪声残余和第二估计噪声残余;
噪声与残余抑制模块,用于根据所述第一估计噪声残余和所述第二估计噪声残余,分别对所述主驾驶方向第一语音和所述副驾驶方向第一语音进行噪声与残余抑制,得到主驾驶方向第二语音和副驾驶方向第二语音。
第三方面,本发明实施例还提供了一种电子设备,该设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明任意实施例所述的一种车载语音处理方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明任意实施例所述的一种车载语音处理方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大众问问(北京)信息科技有限公司,未经大众问问(北京)信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011057299.6/2.html,转载请声明来源钻瓜专利网。