[发明专利]一种基于KL散度的神经网络模型性能评估方法在审
申请号: | 202210281756.2 | 申请日: | 2022-03-22 |
公开(公告)号: | CN114861866A | 公开(公告)日: | 2022-08-05 |
发明(设计)人: | 韩振华;李艳鹏;欧阳鹏 | 申请(专利权)人: | 北京清微智能信息技术有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04 |
代理公司: | 北京索睿邦知识产权代理有限公司 11679 | 代理人: | 朱玲 |
地址: | 102600 北京市大兴区北京经济技*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 kl 神经网络 模型 性能 评估 方法 | ||
1.一种基于KL散度的神经网络模型性能评估方法,其特征在于,包括步骤:
步骤S1,建立数据集,并从所述数据集中抽取样本建立测试样本集,抽取样本的方法为随机抽取,抽取的样本量为128;
步骤S2,加载神经网络模型,在所述神经模型的前向推理过程,对所述测试样本集进行循环遍历,依次读取所述测试样本集中的样本;
步骤S3,对所述神经网络的卷积层进行特征提取,将提取出来的高维特征进行t-SNE降维,并计算出降维特征的概率;
步骤S4,根据所述概率密度计算出真实数据和噪声数据特征之间的KL散度,并评估模型。
2.根据权利要求1所述的一种基于KL散度的神经网络模型性能评估方法,其特征在于,步骤S1中所述的测试样本集,是由真实数据和噪声数据,按照1:1的比例混合而成,所述噪声数据是对真实数据添加随机噪声而生成的数据,具体计算公式为:
其中,
3.根据权利要求1所述的一种基于KL散度的神经网络模型性能评估方法,其特征在于,步骤S3包括步骤:
步骤S301,对所述神经网络的卷积层进行特征提取;
步骤S302,将提取出来的高维特征进行降维,具体计算公式为:
其中,,表示降维后的结果,t表示迭代次数,表示学习率,表示动量,F表示损失函数;
步骤S302,计算出降维特征的概率,具体计算公式为:
其中,为低维空间中特征点之间的概率,,表示初始化高维数据的结果。
4.根据权利要求3所述的一种基于KL散度的神经网络模型性能评估方法,其特征在于,步骤S301中所述的对所述神经网络的卷积层进行特征提取,包括提取神经网络最后一层卷积层的特征和提取神经网络多层卷积的融合特征。
5.根据权利要求1所述的一种基于KL散度的神经网络模型性能评估方法,其特征在于,步骤S4包括步骤:
步骤S401,根据低维空间中特征点之间的概率,计算出真实数据特征与噪声数据特征之间的KL散度,计算公式为:
其中,表示KL散度,表示真实数据特征点之间的概率,表示噪声数据特征点之间的概率;
步骤S402,计算测试样本集中真实数据和噪声数据特征之间KL散度矩阵:
其中,表示KL散度,表示样本量大小;
步骤S403,根据KL散度矩阵计算其行列式的值,具体公式如下:
步骤S404,根据行列式的值value评估模型的性能。
6.根据权利要求5所述的一种基于KL散度的神经网络模型性能评估方法,其特征在于,步骤S404中所述的根据行列式的值value评估模型的性能,具体计算公式为:
其中,C表示测试数据集中样本的类别数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京清微智能信息技术有限公司,未经北京清微智能信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210281756.2/1.html,转载请声明来源钻瓜专利网。