[发明专利]一种样本生成方法及装置有效
申请号: | 201811465635.3 | 申请日: | 2018-12-03 |
公开(公告)号: | CN109598334B | 公开(公告)日: | 2021-06-29 |
发明(设计)人: | 邹权臣;马金鑫;张利;吴润浦;王欣 | 申请(专利权)人: | 中国信息安全测评中心 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06F11/36 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100085 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 样本 生成 方法 装置 | ||
1.一种样本生成方法,其特征在于,包括:
将预先采集的训练集中的数据输入神经网络模型,得到样本生成模型,所述神经网络模型为采用了注意力机制的神经网络模型;
将预先采集的测试集中的数据输入所述样本生成模型,生成样本;
其中,所述样本为对目标软件进行模糊测试所需的样本,所述训练集中的数据和所述测试集中的数据为能被所述目标软件读取的数据;
所述预先采集的训练集和预先采集的测试集的生成过程,包括:
采集初始数据,得到初始数据集,所述初始数据为能被所述目标软件读取的数据;
按照预设的比例将所述初始数据集划分为训练集和测试集,所述训练集中包含生成所述样本生成模型的一个或多个输入输出数据组,所述测试集中包含生成样本所需的数据,所述训练集为所述预先采集的训练集,所述测试集为所述预先采集的测试集;
所述神经网络模型包括输入层、第一双向长短期记忆网络层、第二双向长短期记忆网络层、注意力机制层、变平层和全连接层,其中,所述注意力机制层能够根据当前使用的输入输出数据组中输入数据与输出数据的相关性为输入数据的字符赋予不同的权重。
2.根据权利要求1所述的样本生成方法,其特征在于,所述将预先采集的测试集中的数据输入所述样本生成模型,生成样本,包括:
将预先采集的测试集中的数据同时输入多个样本生成模型,生成多个样本,所述多个样本生成模型均为所述神经网络模型根据所述预先采集的训练集中的数据经过不同训练轮次得到的。
3.根据权利要求1所述的样本生成方法,其特征在于,所述将预先采集的测试集中的数据输入所述样本生成模型,生成样本,包括:
以固定长度的字符选择窗口在预先采集的测试集中选取前缀字符串;
将所述前缀字符串输入所述样本生成模型,生成所述初始数据中所有唯一性字符的概率分布;
对所述所有唯一性字符的概率分布进行温度采样,得到一个字符;
将多次生成所述所有唯一性字符的概率分布并进行温度采样得到的字符组合成样本。
4.一种样本生成装置,其特征在于,包括:
第一生成单元,用于将预先采集的训练集中的数据输入神经网络模型,得到样本生成模型,所述神经网络模型为采用了注意力机制的神经网络模型;
第二生成单元,用于将预先采集的测试集中的数据输入所述样本生成模型,生成样本;
其中,所述样本为对目标软件进行模糊测试所需的样本,所述训练集中的数据和所述测试集中的数据为能被所述目标软件读取的数据;
采集单元,用于采集初始数据,得到初始数据集,所述初始数据为能被所述目标软件读取的数据;
划分单元,用于按照预设的比例将所述初始数据集划分为训练集和测试集,所述训练集中包含生成所述样本生成模型的一个或多个输入输出数据组,所述测试集中包含生成样本所需的数据,所述训练集为所述预先采集的训练集,所述测试集为所述预先采集的测试集;
其中,所述神经网络模型包括输入层、第一双向长短期记忆网络层、第二双向长短期记忆网络层、注意力机制层、变平层和全连接层,其中,所述注意力机制层能够根据当前使用的输入输出数据组中输入数据与输出数据的相关性为输入数据的字符赋予不同的权重。
5.根据权利要求4所述的样本生成装置,其特征在于,所述第二生成单元,用于将预先采集的测试集中的数据同时输入多个样本生成模型,生成多个样本,所述多个样本生成模型均为所述神经网络模型根据所述预先采集的训练集中的数据经过不同训练轮次得到的。
6.根据权利要求4所述的样本生成装置,其特征在于,所述第二生成单元,包括:
选取单元,用于以固定长度的字符选择窗口在预先采集的测试集中选取前缀字符串;
第三生成单元,用于将所述前缀字符串输入所述样本生成模型,生成所述初始数据中所有唯一性字符的概率分布;
采样单元,用于对所述所有唯一性字符的概率分布进行温度采样,得到一个字符;
组合单元,用于将多次生成所述所有唯一性字符的概率分布并进行温度采样得到的字符组合成样本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国信息安全测评中心,未经中国信息安全测评中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811465635.3/1.html,转载请声明来源钻瓜专利网。