[发明专利]一种基于覆盖率的神经网络有效数据增强方法有效
申请号: | 202011562234.7 | 申请日: | 2020-12-25 |
公开(公告)号: | CN112712163B | 公开(公告)日: | 2022-10-14 |
发明(设计)人: | 薛云志;孟令中;董乾;康舒婷;杨光;师源;武斌 | 申请(专利权)人: | 中国科学院软件研究所 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 司立彬 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 覆盖率 神经网络 有效 数据 增强 方法 | ||
1.一种基于覆盖率的神经网络有效数据增强方法,其步骤包括:
1)根据待训练的神经网络模型选取训练数据集并为该神经网络模型选取多个覆盖率指标;其中,待训练的神经网络模型为语言模型,所述训练数据集中的样本数据为文本类数据,所述覆盖率指标包括隐藏单元覆盖率、正向序列覆盖率和负向序列覆盖率;所述隐藏单元覆盖率其中,NUM_hidden_activated表示神经网络模型中被激活的隐藏单元数量,NUM_hidden表示神经网络模型的隐藏单元总数;序列覆盖率范围反映了有关连续隐藏层状态的信息,它由元素zt正向传播时激活的神经元构成的正向序列数量和元素zt反向传播时激活的神经元构成的负向序列数量组成,元素zt是文本长度为T的序列所有可能的顺序中第t种排列的方式;所述正向序列覆盖率所述负向序列覆盖率其中,表示正向序列的总数、表示负向序列的总数;
2)利用该训练数据集对该待训练的神经网络模型进行训练,并统计训练时该神经网络模型中不同覆盖率指标对应的被激活的神经元个数;
3)根据各覆盖率指标对应的被激活的神经元个数计算该训练数据集的各覆盖率指标值;然后根据各所述覆盖率指标值选择一个与该神经网络模型准确度最相关的覆盖率指标作为评价指标;
4)对该训练数据集进行扩充,得到扩充数据集;
5)利用步骤1)训练后的神经网络模型分别测试该训练数据集的评价指标值、该扩充数据集的评价指标值;如果该扩充数据集的评价指标值大于该训练数据集的评价指标值,则将该扩充数据集作为有效数据集;否则将该训练数据集作为无效数据集。
2.如权利要求1所述的方法,其特征在于,根据各所述覆盖率指标与神经网络模型准确率的皮尔逊相关系数,选择与该神经网络模型准确度最相关的覆盖率指标作为评价指标。
3.一种神经网络模型训练方法,其特征在于,采用权利要求1所述方法得到的有效数据集对待训练的神经网络模型进行训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院软件研究所,未经中国科学院软件研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011562234.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种水利工程运营维护用的防冻闸门装置
- 下一篇:一种连续钢桁梁架设施工方法