[发明专利]声纹提取方法、身份识别方法及相关设备在审
申请号: | 202210239481.6 | 申请日: | 2022-03-11 |
公开(公告)号: | CN114783415A | 公开(公告)日: | 2022-07-22 |
发明(设计)人: | 李晋;方昕;褚繁;高天;胡郁;戴礼荣 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/08 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 刘希 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声纹 提取 方法 身份 识别 相关 设备 | ||
本申请公开了一种声纹提取方法、身份识别方法、声纹提取装置、身份识别装置、电子设备及计算机可读存储介质。该声纹提取方法包括:基于目标对象的第一语谱图进行特征提取,得到若干音素片段的特征序列;其中,特征序列包括至少一个帧级特征;基于音素片段的特征序列进行特征统计,得到音素片段的音素特征;基于若干音素片段的音素特征,得到所述目标对象的声纹特征。通过上述方式,能够提高声纹特征的鲁棒性和准确性。
技术领域
本申请涉及语音处理技术领域,特别是涉及一种声纹提取方法、身份识别方法、声纹提取装置、身份识别装置、电子设备及计算机可读存储介质。
背景技术
声纹特征是身份识别、大数据分析等应用场景中充当重要的角色。以身份识别为例,身份识别又可以细分为金融领域的身份识别、安防领域的身份识别、智能家居领域的身份识别等等。将声纹特征应用于身份识别,可以在身份识别对象不知情的情况下,实现身份识别,具有较高的接受度。
声纹特征的性能影响着各应用场景下的处理效果。但是,目前声纹提取方法得到的声纹特征的性能不够好。
发明内容
本申请提供一种声纹提取方法、身份识别方法、声纹提取装置、身份识别装置、电子设备及计算机可读存储介质,能够解决目前声纹提取方法得到的声纹特征的性能不够好的问题。
为解决上述技术问题,本申请采用的一个技术方案是:提供一种声纹提取方法。该方法包括:基于目标对象的第一语谱图进行特征提取,得到若干音素片段的特征序列;其中,特征序列包括至少一个帧级特征;基于音素片段的特征序列进行特征统计,得到音素片段的音素特征;基于若干音素片段的音素特征,得到所述目标对象的声纹特征。为解决上述技术问题,本申请采用的另一个技术方案是:提供一种身份识别方法。该方法包括:获取待识别对象的第一声纹特征,并获取声纹特征库;其中,声纹特征库包含若干第二声纹特征,各第二声纹特征标注有所属对象的身份信息,且第一声纹特征和/或第二声纹特征基于前述的声纹提取方法提取得到;基于第一声纹特征和声纹特征库进行分析,得到待识别对象的身份信息。
为解决上述技术问题,本申请采用的另一个技术方案是:提供一种声纹提取装置,该装置包括:特征提取模块,用于基于目标对象的第一语谱图进行特征提取,得到若干音素片段的特征序列;其中,特征序列包括至少一个帧级特征;特征统计模块,用于基于音素片段的特征序列进行特征统计,得到音素片段的音素特征;声纹获取模块,用于基于若干音素片段的音素特征,得到目标对象的声纹特征。
为解决上述技术问题,本申请采用的另一个技术方案是:提供一种身份识别装置,该装置包括:特征获取模块,用于获取待识别对象的第一声纹特征,并获取声纹特征库;其中,声纹特征库包含若干第二声纹特征,各第二声纹特征标注有所属对象的身份信息,且第一声纹特征和/或所述第二声纹特征基于如前所述的声纹提取装置提取得到;声纹分析模块,用于基于第一声纹特征和声纹特征库进行分析,得到待识别对象的身份信息。
为解决上述技术问题,本申请采用的另一个技术方案是:提供一种电子设备,该电子设备包括处理器、与处理器连接的存储器,其中,存储器存储有程序指令;处理器用于执行存储器存储的程序指令以实现上述方法。
为解决上述技术问题,本申请采用的又一个技术方案是:提供一种计算机可读存储介质,存储有程序指令,该程序指令被执行时能够实现上述方法。
通过上述方式,本申请先从目标对象的第一语谱图得到音素片段的特征序列,再通过特征统计将音素片段的特征序列转换为音素片段的音素特征,再基于音素特征得到声纹特征。由于特征统计会削弱特征序列中涵盖的不同音素级文本信息之间的差异,使音素特征、基于音素特征得到的声纹特征,能够尽可能少地涵盖目标对象音素级文本信息、尽可能多地保留与目标对象本身的发音特点相关的信息,即尽可能与音素级文本信息解耦,有效利用音素级文本信息并降低音素级文本信息对声纹特征的干扰,提高声纹特征的鲁棒性和准确性。
附图说明
图1是本申请声纹提取方法一实施例的流程示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210239481.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种分布式能源站全负荷调节方法及系统
- 下一篇:一种自动排气阀门