[发明专利]一种基于级联神经网络的高置信改造质量和减假暂量化评估方法在审
申请号: | 201911035856.1 | 申请日: | 2019-10-29 |
公开(公告)号: | CN110837523A | 公开(公告)日: | 2020-02-25 |
发明(设计)人: | 李玉军;邓媛洁;魏莹 | 申请(专利权)人: | 山东大学 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06N3/04;G06N3/08;G06Q10/06;G06Q50/26 |
代理公司: | 济南金迪知识产权代理有限公司 37219 | 代理人: | 许德山 |
地址: | 250199 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 级联 神经网络 置信 改造 质量 减假暂 量化 评估 方法 | ||
1.一种基于级联神经网络的高置信改造质量和减假暂量化评估方法,其特征在于,包括步骤如下:
(1)对原始数据进行预处理;原始数据是指从服刑人员数据库中抽取的所需信息,包括服刑人员的六大维度信息,六大维度信息包括人口数据维度、社会关系维度、生理维度、心理维度、犯罪信息维度和改造教育维度,服刑人员数据库包括服刑人员在狱中的所有记录信息,覆盖服刑人员的入监阶段、服刑阶段和出监阶段数据信息;
对原始数据进行预处理,是指对原始数据即数据集实现数据结构化,是指对数据集中的离散类别字段和连续数值型字段分别处理,构造结构化数据,对离散类别字段进行标签编码,对连续数值型字段进行归一化,使得每个服刑人员的信息都处理为对应的一维特征向量;
(2)对步骤(1)预处理后得到的数据集中的离散无序数据进行预处理:
针对服刑人员改造质量评估的关联属性包括离散类别字段的无序属性及连续数值型字段的连续有序属性;在连续有序属性中,直接在属性值上计算闵可夫斯基距离;在无序属性中,采用VDM算法在属性值上计算VDM距离;将闵可夫斯基距离和VDM距离结合处理混合属性,即服刑人员改造质量评估的关联属性,若在数据集X′有nc个连续有序属性,n-nc个无序属性,给出数据集中服刑人员的样本xi=(xi1;xi2;…;xin)与xj=(xj1;xj2;…;xjn),xi1;xi2;…;xin是样本xi在所有混合属性中的取值,xj1;xj2;…;xjn是样本xj在所有混合属性中的取值,通过式(I)计算出xi和xj混合属性的距离:
式(I)中,MinkovDMP(xi,xj)是xi和xj混合属性的距离,xiu和xju分别是样本xi和xj在第u个属性上的取值,nc是有序属性的个数,p≥1,n是属性的总个数,VDM算法公式如式(II)所示:
式(II)中,mu,a表示在属性u上取值为a的样本数,mu,a,i表示在第i个样本中在属性u上取值为a的样本数,k是样本个数,VDMP(a,b)表示在属性u上两个离散值a和b之间的VDM距离;
(3)改造质量关键影响因子挖掘:
采用Relief F算法,基于特征对近距离样本的区分能力评估特征,进而进行特征选择,即相关特征使同类样本接近,异类样本远离;
基于Relief F算法得到的10个有效影响因子作为服刑人员的特征向量,输入到神经网络,对神经网络进行训练;
(4)搭建级联神经网络模型
在神经网络模型中,集成BP神经网络的数据压缩能力与RBF神经网络任意精度的泛函逼近能力,即将BP神经网络与RBF神经网络串联,构成BP-RBF混合神经网络,BP神经网络、RBF神经网络的层与层之间没有连接,层间神经元全连接;
BP神经网络依次包括第一输入层、第一隐藏层、第一输出层;
RBF神经网络依次包括第二输入层、第二隐藏层、第二输出层;
BP神经网络第一输入层接收步骤(1)预处理后得到的数据集,作为网络输入特征向量,第一输入层和第一隐藏层之间的权重矩阵W的第i行代表网络输入特征向量的第i个维度的权重,权重矩阵是神经网络训练学习时要优化的目标,权重矩阵的元素值代表了输入特征向量的权重信息;第一隐藏层用于BP神经网络的第一输入层和第一输出层的映射,第一隐藏层到第一输出层完成输入数据的压缩,压缩后的维度即为第一输出层的维度;
BP神经网络第一输出层的输出向量再作为RBF神经网络的输入向量进行分类,完成改造质量评估;经过Relief F算法提取的10个有效影响因子作为BP神经网络的输入,BP神经网络的第一输入层节点数为服刑人员数据集的特征维度数目,即10个有效影响因子的维度;RBF神经网络的第二输入层的节点数为BP神经网络输出节点数目,即2,第二隐藏层中神经元的变换函数即径向基函数,是对中心点径向对称且衰减的非负线性函数,对输入向量进行空间映射的变换,即为非线性优化,第二输出层对第二隐藏层进行线性加权调整,即为线性优化;第二隐藏层采用非线性优化策略对第一隐藏层的激活函数的参数进行调整,第二输出层采用线性优化策略对第二隐藏层的输出进行线性加权优化调整;
神经网络模型评估结果为服刑人员5个社会化维度,包括认知社会化、人格社会化、关系社会化、知识社会化和技能社会化,对服刑人员每个社会化维度的评估都采用二分类,以刑满释放人员的出狱数据在五个社会化评估维度的量化指标为标签,刑满释放人员的出狱数据即为出狱后的5个社会化维度的能力指标,分为强弱两个等级,标注信息分别由0、1表示社会化的能力强弱,故RBF神经网络的第二输出层节点数为1;
通过神经网络模型训练得出的误差最小值来确定隐层节点数目;
(5)训练阶段:
把步骤(3)中得到的包含10个有效影响因子的服刑人员数据集随机分为训练集和测试集两部分,训练集依次经过上述BP-RBF级联神经网络的输入层、隐藏层,第二隐藏层的输出为X,经过sigmoid激活函数操作y=sigmoid(WX),W表示第二隐藏层到第二输出层之间的连接权重,最终输出y为在第二输出层中得到对服刑人员的5个社会化维度的二分类指标,即强弱两个等级,分别由0、1来表示;重复上述训练数据的输入,直至神经网络训练过程中的损失函数不再下降后为止,损失函数采用交叉熵形式,进行性能评估与实际应用;
(6)迁移学习:
以上述步骤建模形成的改造质量评估模型,即步骤(5)的训练阶段保存的神经网络模型改造质量评估模型为预训练模型,民警及安置帮教机构综合评价数据为标签,民警及安置帮教机构综合评价数据为在试点监狱入监采集的数据,包含狱中民警和安置帮教机构对服刑人员的减假暂评估方案,利用迁移学习技术,冻结预训练模型中的前k个层中的权重,重新训练后面的n-k个层,得到减假暂量化评估模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911035856.1/1.html,转载请声明来源钻瓜专利网。