[发明专利]对通用背景模型和登记说话者模型进行文本转录适配的说话者验证计算机系统有效
申请号: | 201680083933.9 | 申请日: | 2016-03-23 |
公开(公告)号: | CN108780645B | 公开(公告)日: | 2022-10-28 |
发明(设计)人: | 沃洛佳·格兰恰诺夫;西德格尔·思维里森;厄兰多·卡尔森;哈拉尔德·波布洛斯 | 申请(专利权)人: | 瑞典爱立信有限公司 |
主分类号: | G10L17/20 | 分类号: | G10L17/20;G10L15/26;G10L17/04 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 黄亮 |
地址: | 瑞典斯*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 通用 背景 模型 登记 说话 进行 文本 转录 验证 计算机系统 | ||
1.一种由说话者验证计算机系统(102)执行的用于验证说话者的方法,所述方法包括:
由所述说话者验证计算机系统(102)的至少一个处理器执行以下操作:
获得(400)包含由所述说话者所说的单词序列在内的采样语音数据序列;
产生(200,402)表征所述采样语音数据序列的频谱分布的特征向量序列;
获得(404)由所述说话者所说的单词序列的文本转录;
响应于所述文本转录,适配(210,406)高斯混合模型的通用背景模型UBM-GMM和登记说话者高斯混合模型ENR-GMM的数据结构,以分别产生适配的UBM-GMM和适配的ENR-GMM;
基于所述特征向量序列和所述适配的ENR-GMM的组合产生(220,408)登记说话者概率,并且基于所述特征向量序列和所述适配的UBM-GMM的组合产生通用说话者概率;
基于所述登记说话者概率与所述通用说话者概率的比较,产生(230,410)所述说话者是否是登记说话者的说话者验证指示;以及
基于所述说话者验证指示是否满足定义的规则,选择性地传送(412)所述登记说话者的指示。
2.根据权利要求1所述的方法,其中,所述响应于所述文本转录适配(210,406)UBM-GMM和ENR-GMM的数据结构以分别产生适配的UBM-GMM和适配的ENR-GMM包括:
基于由所述说话者所说的单词序列的文本转录,从驻留在音素储存库(122)中的候选音素集合之中选择(300,500)候选音素序列;
使用将音素映射到所述UBM-GMM中的高斯分量的储存库(124)来选择(320,502)所述UBM-GMM中与所述候选音素序列相对应的高斯分量,以产生UBM高斯序列Gubm;
使用将音素映射到所述ENR-GMM中的高斯分量的储存库(124)来选择(320,504)所述ENR-GMM中与所述候选音素序列相对应的高斯分量,以产生登记高斯序列Genr;
使用所述UBM高斯序列Gubm适配(340,506)所述UBM-GMM的数据结构以产生适配的UBM-GMM;以及
使用所述登记高斯序列Genr适配(340,508)所述ENR-GMM的数据结构以产生适配的ENR-GMM。
3.根据权利要求1至2中的任一项所述的方法,还包括:
对于登记说话者集合中的每个登记说话者,重复(600)适配(210,406)UBM-GMM和ENR-GMM的数据结构、产生(220,408)登记说话者概率和通用说话者概率以及产生(230,410)说话者验证;
其中,所述基于所述说话者验证指示是否满足定义的规则来选择性地传送(412)所述登记说话者的指示包括:
识别(602)所述登记说话者集合中的哪个说话者与所述说话者验证指示中最满足所述定义的规则的一个说话者验证指示相对应;以及
传送(604)针对所识别(602)的一个登记说话者的标识符。
4.根据权利要求1至2中的任一项所述的方法,还包括:
从通过所述说话者验证计算机系统(102)的网络接口从客户端计算机(150b)接收的说话者查询消息(152)获得(700)针对所述登记说话者的标识符;以及
所述基于所述说话者验证指示是否满足定义的规则选择性地传送(412)所述登记说话者的指示包括:
通过所述网络接口向所述客户端计算机(150b)传送(702)包含所述登记说话者的指示在内的响应消息(154)。
5.根据权利要求1至2中任一项所述的方法,其中:
所述获得(400)包含由所述说话者所说的单词序列在内的采样语音数据序列包括:从音频视频储存库(110)内的音轨读取(800)所述采样语音数据序列的间隔;以及
所述获得(404)由所述说话者所说的单词序列的文本转录包括:解析(802)所述音频视频储存库(110)内的隐藏字幕文本串,其中所述隐藏字幕文本串与沿着所述音轨的定时指示符在时间上对准,以获得与所述采样语音数据序列的间隔在时间上对准的文本转录。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于瑞典爱立信有限公司,未经瑞典爱立信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680083933.9/1.html,转载请声明来源钻瓜专利网。