[发明专利]一种针对短语音的说话人识别模型的训练方法及装置有效
申请号: | 201710651305.2 | 申请日: | 2017-08-02 |
公开(公告)号: | CN107369440B | 公开(公告)日: | 2021-04-09 |
发明(设计)人: | 庞在虎;张志平;朱风云 | 申请(专利权)人: | 北京灵伴未来科技有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L17/02;G10L17/04 |
代理公司: | 北京市清华源律师事务所 11441 | 代理人: | 沈泳;王永秀 |
地址: | 100083 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 针对 语音 说话 识别 模型 训练 方法 装置 | ||
本发明公开了一种针对短语音的说话人识别模型的训练方法,包括:从训练语料的语音数据中提取声学特征;对所述训练语料的语音数据进行音素标注得到音素标注结果;利用所述声学特征和所述音素标注结果进行音素相关的GMM‑UBM模型训练,得到说话人相关且音素相关的GMM模型和UBM模型;基于所述音素相关的GMM模型和UBM模型,针对每个音素生成用于提取i‑vector特征的音素相关的i‑vector总体变化矩阵;利用所述音素相关的i‑vector总体变化矩阵,从每个说话人数据中提取音素相关的i‑vector参数,再通过降维得到说话人相关且音素相关的i‑vector特征,作为说话人模型,本发明通过对说话人建立音素相关的i‑vector模型,使模型精度更高,并提高了识别准确率。
技术领域
本发明涉及说话人识别领域,具体涉及一种针对短语音的说话人识别模型的训练方法。本发明同时涉及一种使用说话人识别模型进行针对短语音的说话人识别的装置。
背景技术
作为语音处理领域的主要技术之一,说话人识别以确认说话人身份为目标,在移动交互、身份验证、音频监控等领域有着广泛的应用前景。经过数十年的发展,说话人识别技术已经得到广泛应用。
说话人识别系统通常包括说话人训练阶段和说话人识别阶段。在说话人训练阶段,系统首先对提供的若干训练语音进行静音剔除和降噪处理,尽可能得到纯净有效的语音片段,然后再对这些语音提取对应的声学特征参数,根据系统的建模算法,得到说话人的特征模型。每个说话人对应的训练语音经过训练阶段后得到一个说话人模型。说话人识别阶段就是模式匹配的过程,其主要任务是将输入的待识别说话人语音特征与训练得到的模型集合中所有模型进行匹配,根据最优的匹配结果,判定待识别语音的最优匹配说话人。
近年来,基于i-vector的说话人建模技术取得了很大的进展,使得说话人识别系统的性能得到了显著的提升。在由美国国家标准技术委员会组织的国际说话人评测中,基于i-vector的说话人识别性能明显优于之前广泛采用的高斯混合模型-通用背景模型(Gaussian Mixture Model-Universal background Model,GMM-UBM)、高斯混合模型超矢量-支撑向量机(Gaussian mixture model super vector-Support Vector Machine,GSV-SVM)、联合音子分析(Joint Factor Analysis,JFA)等方法,已成为目前主流的说话人识别技术。
i-vector说话人识别方法是基于GMM-UBM方法发展而来的。它利用GMM-UBM的均值矢量构成反映说话人信息的多维空间,并基于该空间进行统计建模和识别。在目前的方法中,生成i-vector的GMM是由所有训练语料共同训练得到的,也就是说高斯混合模型的均值矢量并不仅仅反映语音中的说话人相关信息,同时也包含了说话人无关信息(如音素相关信息)。对长时语音而言,说话人信息相对音素信息而言更加稳定,说话人识别效果会比较理想。然而对短时语音而言,这种相对稳定性便不再明显,因此会导致说话人识别准确率低。
在现实应用中,并不能保证系统在识别时能够获得足够长时间的测试语音。而目前的说话人识别技术,包括主流的i-vector技术,在基于短语音的说话人识别任务上普遍性能较差。因此,如何能够用较短的测试语音(即短语音)来准确地判断其说话人身份就成为当前该领域亟待解决的问题。
发明内容
本发明提供一种针对短语音的说话人模型的训练方法,以解决现有技术对短语音的说话人识别准确率低的问题。
本发明提供一种针对短语音的说话人识别模型的训练方法,包括:
从训练语料的语音数据中提取声学特征;
对所述训练语料的语音数据进行音素标注得到音素标注结果;
利用所述声学特征和所述音素标注结果进行音素相关的GMM-UBM模型训练,得到说话人相关且音素相关的GMM模型和UBM模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京灵伴未来科技有限公司,未经北京灵伴未来科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710651305.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:矿用本安型控制器
- 下一篇:一种即热式碳纤维地毯