[发明专利]生成式对抗网络的训练方法、装置及电子设备在审
申请号: | 202011562340.5 | 申请日: | 2020-12-25 |
公开(公告)号: | CN112541557A | 公开(公告)日: | 2021-03-23 |
发明(设计)人: | 余晓峰;郑立涛 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/20 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 王萌 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 生成 对抗 网络 训练 方法 装置 电子设备 | ||
本申请公开了一种生成式对抗网络的训练方法、装置及电子设备,涉及人工智能技术领域,尤其涉及深度学习与自然语言处理技术领域。具体实现方案为:确定干扰样本集中各个干扰样本当前分别对应的干扰概率;根据每个干扰样本当前对应的干扰概率,从干扰样本集中获取目标干扰样本;利用生成式对抗网络中的生成器,对目标干扰样本进行处理,以生成判别样本;将判别样本输入生成式对抗网络中的判别器,以获取判别样本属于真实样本的概率;根据判别样本属于真实样本的概率及对应的干扰概率,对生成式对抗网络进行修正。由此,通过这种生成式对抗网络的训练方法,提升了生成式对抗网络的抗噪性和泛化性。
技术领域
本申请涉及计算机技术领域,尤其涉及深度学习、自然语言处理等人工智能技术领域,提出一种生成式对抗网络的训练方法、装置及电子设备。
背景技术
序列标注是信息提取、问答系统、句法分析、机器翻译等应用领域的重要基础工具,在自然语言处理技术走向实用化的过程中占有重要地位。核心词识别作为一种特定的序列标注任务,旨在识别短文本中的用户核心诉求和意图,对广告触发、问题飘红、业务点挖掘都有重要作用。
相关技术中,基于预训练和微调的序列标注模型,需要大量且高质量的标注数据,当标注数据质量不高或标注不一致时,将严重影响模型的性能。
发明内容
本申请提供了一种用于生成式对抗网络的训练方法、装置、电子设备、存储介质以及计算机程序产品。
根据本申请的一方面,提供了一种生成式对抗网络的训练方法,包括:确定干扰样本集中各个干扰样本当前分别对应的干扰概率;根据每个所述干扰样本当前对应的干扰概率,从所述干扰样本集中获取目标干扰样本;利用所述生成式对抗网络中的生成器,对所述目标干扰样本进行处理,以生成判别样本;将所述判别样本输入所述生成式对抗网络中的判别器,以获取所述判别样本属于真实样本的概率;根据所述判别样本属于真实样本的概率及对应的干扰概率,对所述生成式对抗网络进行修正。
根据本申请的另一方面,提供了一种生成式对抗网络的训练装置,包括:第一确定模块,用于确定干扰样本集中各个干扰样本当前分别对应的干扰概率;第一获取模块,用于根据每个所述干扰样本当前对应的干扰概率,从所述干扰样本集中获取目标干扰样本;生成模块,用于利用所述生成式对抗网络中的生成器,对所述目标干扰样本进行处理,以生成判别样本;第二获取模块,用于将所述判别样本输入所述生成式对抗网络中的判别器,以获取所述判别样本属于真实样本的概率;第一修正模块,用于根据所述判别样本属于真实样本的概率及对应的干扰概率,对所述生成式对抗网络进行修正。
根据本申请的再一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如前所述的生成式对抗网络的训练方法。
根据本申请的又一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行如前所述的生成式对抗网络的训练方法。
根据本申请的又一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如前所述的生成式对抗网络的训练方法。
根据本申请的技术方案,解决了相关技术中,基于预训练和微调的序列标注模型,需要大量且高质量的标注数据,当标注数据质量不高或标注不一致时,将严重影响模型的性能的问题。通过根据干扰样本集中各个干扰样本当前分别对应的干扰概率,从干扰样本集中获取目标干扰样本,并利用生成式对抗网络中的生成器,对目标干扰样本进行处理,以生成判别样本;之后将判别样本输入所述生成式对抗网络中的判别器,以获取判别样本属于真实样本的概率,进而根据判别样本属于真实样本的概率及对应的干扰概率,对生成式对抗网络进行修正。由此,通过在训练过程中插入干扰样本,提升了生成式对抗网络对低质量样本的识别能力,从而提升了生成式对抗网络的抗噪性和泛化性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011562340.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种护肤面膜及其制备方法
- 下一篇:一种智能防冻风力发电装置