[发明专利]基于对数似然值归一化的说话人确认方法有效
申请号: | 202010749440.2 | 申请日: | 2020-07-30 |
公开(公告)号: | CN111883142B | 公开(公告)日: | 2022-05-31 |
发明(设计)人: | 梁春燕;曹伟 | 申请(专利权)人: | 山东理工大学 |
主分类号: | G10L17/04 | 分类号: | G10L17/04;G10L17/02;G10L25/24 |
代理公司: | 成都方圆聿联专利代理事务所(普通合伙) 51241 | 代理人: | 李鹏 |
地址: | 255086 山东省淄*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 对数 似然值 归一化 说话 确认 方法 | ||
本发明提供一种基于对数似然值归一化的说话人确认方法,假设是某测试语音在所有L个说话人模型上的得分;设St为测试语音与其目标说话人模型的得分,即该测试语音对应的“True”识别对得分;其余L‑1个得分Sn,n≠t,为测试语音与非目标说话人模型的得分,即该测试语音对应的“False”识别对得分;用对数似然值归一化公式来规整每个得分:Si表示该测试语音在第i个说话人模型上的原始得分,S′i是经过规整后的得分,表示对得分Si的规整量,令则Ni由除Si之外的其余L‑1个得分计算得到。本发明使同一测试语音对应的两类识别对得分混叠现象得到有效改善;并且可以直接对测试得分进行规整,不需要预留训练数据。
技术领域
本发明涉及说话人识别技术领域,具体涉及一种基于对数似然值归一化的说话人确认方法。
背景技术
说话人确认是判断测试语音是否属于某个预先声明的说话人,即需要将测试识别对(由测试语音和其声明的说话人身份构成)作出“True”或“False”的二类判决。但是“True”和“False”两类识别对的得分会出现严重的交叉和混叠;在这种情况下使用统一的门限对每一个识别对作“True”或“False”的判决,会严重影响说话人确认系统的性能。因此,需要在识别对原始得分的基础上进行得分规整。
目前最常用也是最典型的得分规整方法有零规整(Zero normalization,Znorm)、测试规整(Test normalization,Tnorm)以及两者的结合算法ZTnorm等,它们通过估计“False”识别对的得分分布,对测试识别对的得分进行规整,将“False”识别对的得分规整为均值为0、方差为1的分布,从而消除不同说话人模型间的差异或不同测试语音之间的差异,有效减小两类识别对得分汇集后的混叠部分,从而提高说话人确认的系统性能。一般来说,得分规整不受限于系统所使用的说话人模型建立方法,无论是简单基础的高斯混合模型-通用背景模型(Gaussian Mixture Model-Universal Background Model,GMM-UBM),还是目前比较主流的联合因子分析(Joint Factor Analysis,JFA)、总变化因子分析(TotalVariability Factor Analysis)技术等,原始测试得分均需要进行得分规整,而现有的得分规整方法也都适用于基于以上不同说话人模型的确认系统。
现有的得分规整方法中,大多数都是通过规整“False”识别对得分分布的方式,以减小两类识别对得分汇集后的重叠部分,却没有有效扩大同一说话人模型或同一测试语音对应的两类识别对得分之间的差距;并且,在这些得分规整方法中,都需要预先收集和选取大量的非目标说话人语音数据来估计“False”识别对得分的均值和方差,而非目标说话人语音数据选取的好坏会影响最终得分规整的效果。
发明内容
针对现有得分规整方法的以上不足,本发明提出一种对数似然值归一化得分规整算法(Log-likelihood Normalization,LLN),通过扩大同一测试语音在目标说话人模型与非目标说话人模型上的得分差距,使同一测试语音对应的两类识别对得分混叠现象得到有效改善;与Znorm、Tnorm和ZTnorm等方法相结合,可同时从不同角度解决两类识别对得分汇集后的混叠问题,从而进一步提高系统识别性能。
具体技术方案为:
基于对数似然值归一化的说话人确认方法,包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东理工大学,未经山东理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010749440.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种CML到化学盲文的转换系统及方法
- 下一篇:显示面板及其控制方法