[发明专利]生成语音鉴别模型的连续学习方法、装置和电子设备有效
申请号: | 202310017442.6 | 申请日: | 2023-01-06 |
公开(公告)号: | CN115938390B | 公开(公告)日: | 2023-06-30 |
发明(设计)人: | 陶建华;张晓辉;易江燕 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G10L25/30 | 分类号: | G10L25/30;G10L25/51;G10L15/06 |
代理公司: | 北京华夏泰和知识产权代理有限公司 11662 | 代理人: | 邓菊香 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 生成 语音 鉴别 模型 连续 学习方法 装置 电子设备 | ||
本发明涉及一种生成语音鉴别模型的连续学习方法、装置和电子设备,生成语音鉴别模型的连续学习方法包括:获取源数据集,根据源数据集,确定第一数据模型;获取目标数据集,根据目标数据集,对第一数据模型进行梯度修正,以得到第二数据模型;对第二数据模型进行正则化修正,以得到目标数据模型。
技术领域
本发明涉及数据模型开发技术领域,尤其涉及一种生成语音鉴别模型的连续学习方法、装置和电子设备。
背景技术
近年来,随着深度学习的快速发展,语音转换和语音合成技术也日趋成熟,深度模型产生的生成语音已达到与真人相媲美的程度,在人机交互、智能家居、娱乐、教育等领域有广泛的应用。随着相关研究的推进,基于深度学习的生成语音检测模型在部分数据集上表现优异,但在跨数据集场景下,语音检测模型的准确率会大幅的降低。
发明内容
有鉴于此,本发明提供一种生成语音鉴别模型的连续学习方法、装置和电子设备。
具体地,本发明是通过如下技术方案实现的:
根据本发明的第一方面,提供一种生成语音鉴别模型的连续学习方法,生成语音鉴别模型的连续学习方法包括:获取源数据集,根据源数据集,确定第一数据模型;获取目标数据集,根据目标数据集,对第一数据模型进行梯度修正,以得到第二数据模型;对第二数据模型进行正则化修正,以得到目标数据模型。
本发明提供的生成语音鉴别模型的连续学习方法的技术方案的执行主体可以为连续学习装置,还可以根据实际使用需求进行确定,在此不作具体限定。为了更加清楚地描述本发明提供的生成语音鉴别模型的连续学习方法,下面以连续学习装置为执行主体进行说明。
在该技术方案中,提供了一种生成语音鉴别模型的连续学习方法,连续学习装置通过源数据集,建立并训练第一数据模型,其中,源数据集为用于训练数据模型的数据集,第一数据模型为通过源数据集训练得到的数据模型,数据模型为能够识别具体数据的模型文件。在一些实施例中,源数据集可以具体为包括真实语音数据和虚拟语音数据的数据集,其中,虚拟语音数据可以为计算机合成的语音数据,真实语音数据可以为用户录制的语音数据。第一数据模型可以具体为识别语音为真实语音或者虚拟语音的数据模型。
连续学习装置获取目标数据集,通过目标数据集对第一数据模型进行再次训练,在训练第一数据模型的过程中,连续学习装置通过目标数据集,修正第一数据模型的梯度参数,进而得到第二数据模型,其中,目标数据集为应用第一数据模型的应用数据集,第二数据模型为第一数据模型修正后的数据模型,梯度参数为表示数据模型中变化率最大向量参数。在一些实施例中,目标数据集可以具体为应用级的数据集,梯度参数可以具体包括第一数据模型的梯度下降方向,第二数据模型可以具体为修正梯度下降方向的数据模型。
确定第二数据模型之后,连续学习装置对第二数据模型进行正则化修正,将第二数据模型更新为目标数据模型,其中,目标数据模型为在第二数据模型的基础上优化后的数据模型,正则化修正为对数据模型的参数进行限制的过程。
在一些实施例中,目标数据模型可以具体为能够高准确率识别真实语音和虚拟语音的数据模型,正则化修正可以具体为对数据模型的输出参数进行规则化的过程。
在一些实施例中,连续学习装置可以通过目标数据集,连续多次对第一数据模型进行数据训练,同时可以对第一数据模型进行梯度修正,得到第二数据模型,并对第二数据模型进行正则化约束,进而得到目标数据模型。
在一些实施例中,源数据集可以具体为连续学习过程中的源数据集。
在一些实施例中,目标数据集可以具体为连续学习过程中的目标数据集。
在一些实施例中,在连续学习的过程中,目标数据集会对源数据集产生灾难性遗忘,导致目标数据集对源数据集的识别准确率大幅度下降,连续学习装置通过目标数据集,优化第一数据模型,得到目标数据模型,在提高目标数据模型对于目标数据集的识别准确率的基础上,保证了目标数据集对源数据集的识别准确率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310017442.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种绝缘涂布生产线及其实现方法
- 下一篇:一种岩棉复合的制造工艺