[发明专利]基于自审视的多单元反馈网络模型、设备和存储介质在审
申请号: | 202110236817.9 | 申请日: | 2021-03-03 |
公开(公告)号: | CN113011582A | 公开(公告)日: | 2021-06-22 |
发明(设计)人: | 李阳;孙芳蕾;杨旸;汪军;温颖 | 申请(专利权)人: | 上海科技大学 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04 |
代理公司: | 上海光华专利事务所(普通合伙) 31219 | 代理人: | 李治东 |
地址: | 201210 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 审视 单元 反馈 网络 模型 设备 存储 介质 | ||
本申请提供的一种基于自审视的多单元反馈网络模型、设备和存储介质,该反馈网络模型主要由三个智能体组成:编码单元、自审视单元、及解码智单元。自审视单元将编码智能体编码结果作为输入,对编码结果进行再处理,纠错后再输入到编码单元中进行编码,最后解码单元进行解码三个智能体紧密合作使得整个网络有着更强的反思纠错能力。
技术领域
本发明涉及深度学习网络模型研究技术领域,特别是涉及一种基于自审视的多单元反馈网络模型、设备和存储介质。
背景技术
深度学习建立在连接主义和神经科学理论技术上,其通过使用人工神经网络来模拟大脑的感知过程。受益于数十年来计算能力的提升和大规模数据样本的出现,深度学习在机器翻译,语音识别,语音合成,图像处理等领域取得了突破性的进展。
但现在的神经网络还和人脑中复杂的神经系统系统有着较大的差距,现有的神经网络大多是前馈结构或者拥有朴素的循环、反馈结构,而缺乏像人类一样的反思能力。前馈神经网络,比如卷积神经网络,数据都是单一从输入流向输出,这样的结构也使得神经网络无法利用高层已经处理过的信息进行反思完善自己。因此前馈神经网络并不能满足人们对深度学习更智能的要求,在一些神经科学研究的启发下,一些改进算法随之被提出。神经科学研究表明在人类大脑中存在着大量的循环反馈机制来进行视觉处理。受这些神经科学研究启发,ConvRNNs[1],RIG-Net[2],RethinkingCNN[3]和LoopyNets[4]等方法引入了循环反馈结构来解决图像识别问题。一方面他们使用循环结构来提升分类正确率,另一方面像ConvRNNs,RethinkingNets,LoopyNets等模型在中间层添加一条反馈回路将中间层信息反馈至底层神经元。这些现有的工作都在尝试在现有神经网络架构的基础上实现类似于人脑的反思能力,但这些方法都只是简单的模拟大脑中的神经网络的反馈回路结构,并不具有对中间层或者顶层信息进行自我审视反思的能力。
ConvRNNs提出现有的卷积神经网络并不具备生物视觉系统中普遍存在的体系结构特征:皮质区域内的局部循环以及下游区域到上游区域的远程反馈。因此他们探究了反馈在改善分类性能中的作用,标准结构的循环比如递归神经网络(RRNs),长短时记忆模型(LSTM)和卷积神经网络融合并不能取得更好的性能表现,而在循环中添加两个新的结构特征:旁路和门控能够大大的提高任务的准确度。作者们依据这些设计原则自动搜索了数千种网络结构,找到了一种新的局部循环单元和对物体识别有用的远程反馈连接。
RIG-Net提出了一种称为RIG-Net的递归迭代门控方案。RIG-Net的核心元素涉及循环连接,这些连接采用自上而下的方式控制神经网络中的信息流,并考虑了核心结构上的不同变体。这种机制的迭代性质允许门控在空间范围和特征空间中扩展。并通过实验表明该迭代反馈机制与现有的常见网络有着较好的兼容性。其主要技术方案设计:1)网络中的某些层的输出通过门控模块反馈到较早的层,简单的门控模块比如恒等映射等;2)通过级联/乘法/加法将反馈与较早层的表示进行组合,来生成下一次迭代的输入。在提出的RIG-Net框架中,将各层的反馈调制形成该层的输入信号模仿视觉的注意力机制,并引入了层次结构,从而导致隐式的从粗到细的表达来提高空间和语义环境的推理表现。该技术方案在前馈网络中集成了迭代反馈模块,这些模块可以看作是更具后向流动的信息重新路由捕获的新的信息,并在更高的层次上模拟了人脑的循环结构。
LoopyNets提出当前的人工神经网络是非循环计算图,人工网络中的神经元只发射一次,没有时间动力。这两个特性与神经科学关于人脑连接性的知识形成了鲜明的对比,尤其是在物体识别方向。因此,该方案提出通过展开循环神经网络的几个时间不来模拟大脑中的反馈循环,并比较了循环的不同结构,包括输入的乘法组成和输入的加法组成。该技术方案类似于递归神经网络(RNN)。该模型进一步由参数K(展开系数)决定,该参数决定执行循环的次数。通过添加类似于RNN的反馈机制允许低层网络指导较高层特征的权重,可以对较低层的权重进行更精细的选择。通过反馈机制,及时很浅的人工神经网络也能拥有类似于深层的神经网络表现,但是和相同深度的神经网络相比,展开的网络使用的参数要少的多,但两个网络使用的参数要少得多。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海科技大学,未经上海科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110236817.9/2.html,转载请声明来源钻瓜专利网。