[发明专利]一种通用化的人工神经网络无监督本地学习方法、系统及应用在审
申请号: | 202211165236.1 | 申请日: | 2022-09-23 |
公开(公告)号: | CN115456173A | 公开(公告)日: | 2022-12-09 |
发明(设计)人: | 周洪超;黄卫平;贲晛烨;杨刚强 | 申请(专利权)人: | 山东大学 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04;G06K9/62 |
代理公司: | 济南金迪知识产权代理有限公司 37219 | 代理人: | 杨树云 |
地址: | 250199 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 通用 人工 神经网络 监督 本地 学习方法 系统 应用 | ||
1.一种通用化的人工神经网络无监督本地学习方法,其特征在于,人工神经网络为一个多层的神经网络,包括:每层的参数通过无监督本地学习方法训练,每层的参数w使用一个矩阵来表示,该矩阵描述了两层神经元之间的连接权重;给定了某一层的输入数据x,该层的输出为f(wTx),f为非线性激活函数,每一层神经元的训练方法如式(I)所示:
△wij=ηyj(xi-∑kykwik) (I)
式(I)中,wij是指人工神经网络中下一层的神经元i和本层神经元j之间的连接权重,△wij是该连接权重的变化量,η是学习率,xi是训练时来自于神经元i的输入,yj=∑jxiwij是神经元j的总加权输入或者yj=f(∑jxiwij)是神经元j的输出,∑kykwik是指来自于反馈的衰减项,k遍历了本层的所有神经元;
在训练某一层神经元的时候,给定一个训练样本,通过前馈的方式计算出本层的输入x和y=wTx,并根据式(I)计算出本层参数的修改量△wij,,最后将wij替换成wij+△wij。
2.根据权利要求1所述的一种通用化的人工神经网络无监督本地学习方法,其特征在于,所述式(I)用矩阵和向量的形式表示,如式(II)所示:
△w=ηy(x-wy)T (II)
式(II)中w是本层的参数即连接权重,x是本层的输入向量,y=wTx是总加权输入,(x-wy)T是x-wy的转置;
或者,所述式(I)拓展成更普遍的形式,如式(III)所示:
△w=ηf(y)(x–g(w,y))T (III)
式(III)中,w是本层的参数即连接权重,x是本层的输入向量,y=wTx是总加权输入,f(y)是y的一个函数,g(w,y)是w和y的一个函数。
3.根据权利要求1所述的一种通用化的人工神经网络无监督本地学习方法,其特征在于,所述人工神经网络中每一层是全连接层、本地连接层或卷积层;在卷积层的训练中,计算不同位置的△wij的平均值,并根据该平均值来更新wij。
4.根据权利要求1所述的一种通用化的人工神经网络无监督本地学习方法,其特征在于,无监督本地学习方法自底向上的训练任意多层的神经网络;每一层都从之前一层的数据中提取主要特征,并通过非激活函数对数据进行变换;训练后的人工神经网络实现非监督的特征提取,越高的特征层表示越复杂的特征。
5.根据权利要求1所述的一种通用化的人工神经网络无监督本地学习方法,其特征在于,人工神经网络中的非激活函数采用平方函数,每一层的输出特征进行层归一化处理。
6.根据权利要求1所述的一种通用化的人工神经网络无监督本地学习方法,其特征在于,人工神经网络每一层逐层训练或所有层联合一起训练;如果每一层逐层训练,从最底层开始,依次向上逐层训练;如果所有层联合一起训练,在训练过程中同时学习调整所有层的参数。
7.权利要求1-6任一所述的一种基于人工神经网络无监督本地学习方法的应用,其特征在于,包括用于分类识别、工业检测、医学影像诊断、图像分割、时序预测、文本翻译、语音识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211165236.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种户外开关柜
- 下一篇:一种加密数据分级解密方法及AI系统