[发明专利]声音信号处理的方法、装置、设备、计算机可读存储介质有效
申请号: | 202011481460.2 | 申请日: | 2020-12-15 |
公开(公告)号: | CN112634909B | 公开(公告)日: | 2022-03-15 |
发明(设计)人: | 马啸空;蒋逸恒;张策;张涛涛 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G10L17/00 | 分类号: | G10L17/00;G10L15/18;G10L15/02 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 赵林琳 |
地址: | 100094 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声音 信号 处理 方法 装置 设备 计算机 可读 存储 介质 | ||
根据本公开的示例实施例,提供了一种声音信号处理的方法、装置、设备、计算机可读存储介质和计算机程序产品。涉及人工智能领域,尤其涉及语音和深度学习技术领域。具体实现方案为:获取与用户的声音相对应的第一类型的第一声音信号和第二类型的第二声音信号;基于第一声音信号与第一类型模型库中的用户模型的比较和第二声音信号与第二类型模型库中的用户模型的比较,确定与用户的声音相匹配的第一用户模型,以识别用户的身份;如果确定第一用户模型在第一类型模型库中,将第二声音信号与用户的身份相关联地存储;以及基于第二声音信号建立与用户的身份相关联的第二用户模型。根据本公开的实施例,可以准确地识别用户语音,还可以提高用户操作的便利性。
技术领域
本公开涉及信息处理领域,并且更具体地,涉及声音信号处理的方法、装置、设备、计算机可读存储介质和计算机程序产品。
背景技术
随着人工智能技术的普及,尤其是语音交互的发展,各种搭载语音技术的设备走进人们的生活。其中,能够自动识别说话人身份的声纹识别技术成为智能设备的标配之一。声纹识别技术即说话人语音的识别技术,该技术通过声音信号提取代表说话人身份的相关特征,例如反映声门开合频率的基频特征、反映口腔大小形状及声道长度的频谱特征等,进而通过语音识别用户的身份。
声纹识别应用包括两个阶段,注册阶段和运行阶段。在注册阶段,生成与用户的身份相对应的用户模型。在运行阶段,通过用户语音与用户模型的匹配,识别出当前用户的身份。然而,在声纹系统升级时,往往需要用户录入语音来重新注册,从而导致操作的便利性不足。
发明内容
根据本公开的示例实施例,提供了一种声音信号处理的方法、装置、设备、计算机可读存储介质和计算机程序产品。
在本公开的第一方面中,提供了一种声音信号处理的方法,包括:获取与用户的声音相对应的第一类型的第一声音信号和第二类型的第二声音信号;基于第一声音信号与第一类型模型库中的用户模型的比较和第二声音信号与第二类型模型库中的用户模型的比较,确定与用户的声音相匹配的第一用户模型,以识别用户的身份;如果确定第一用户模型在第一类型模型库中,将第二声音信号与用户的身份相关联地存储;以及基于第二声音信号建立与用户的身份相关联的第二用户模型。
在本公开的第二方面中,提供了一种声音信号处理的装置,包括:第一声音信号获取模块,被配置为获取与用户的声音相对应的第一类型的第一声音信号和第二类型的第二声音信号;第一匹配模块,被配置为基于第一声音信号与第一类型模型库中的用户模型的比较和第二声音信号与第二类型模型库中的用户模型的比较,确定与用户的声音相匹配的第一用户模型,以识别用户的身份;关联模块,被配置为如果确定第一用户模型在第一类型模型库中,将第二声音信号与用户的身份相关联地存储;以及第一模型建立模块,被配置为基于第二声音信号建立与用户的身份相关联的第二用户模型。
在本公开的第三方面中,提供了一种电子设备,包括一个或多个处理器;以及存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现根据本公开的第一方面的方法。
在本公开的第四方面中,提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现根据本公开的第一方面的方法。
在本公开的第五方面中,提供了一种计算机程序产品,包括计算机程序指令,该计算机程序指令被处理器实现如本公开的第一方面的方法。
应当理解,发明内容部分中所描述的内容并非旨在限定本公开的实施例的关键或重要特征,亦非用于限制本公开的范围。本公开的其它特征将通过以下的描述变得容易理解。
附图说明
结合附图并参考以下详细说明,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标记表示相同或相似的元素。附图用于更好地理解本方案,不构成对本公开的限定,其中:
图1示出了本公开的多个实施例能够在其中实现的示例环境的示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011481460.2/2.html,转载请声明来源钻瓜专利网。