[发明专利]用于增强学习的神经模型有效
申请号: | 201380063033.4 | 申请日: | 2013-05-16 |
公开(公告)号: | CN104823205B | 公开(公告)日: | 2019-05-28 |
发明(设计)人: | 科里·M·蒂博;纳拉延·斯里尼瓦桑 | 申请(专利权)人: | HRL实验室有限责任公司 |
主分类号: | G06N3/02 | 分类号: | G06N3/02 |
代理公司: | 北京天昊联合知识产权代理有限公司 11112 | 代理人: | 顾丽波;井杰 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种用于增强学习和行动选择的神经模型,该神经模型包括多个通道、位于每个通道中的输入神经元组、位于每个通道中的输出神经元组,每个通道中的每组输入神经元耦接到每个通道中的每组输出神经元,还包括位于每个通道中的奖赏神经元组。每个通道的奖赏神经元组接收来自环境输入的输入,并且只耦接到奖赏神经元所属的通道中的输出神经元。如果通道的环境输入是正的,则相应通道的输出神经元被奖赏并具有增强的响应,否则,相应通道的输出神经元被惩罚并具有衰减的响应。 | ||
搜索关键词: | 用于 增强 学习 神经 模型 | ||
【主权项】:
1.一种用于增强学习和行动选择的神经网络,该神经网络包括:多个通道;位于每个通道中的输入神经元组,其中所述输入神经元组包括无源电子组件和有源电子组件,该无源电子组件和该有源电子组件包括晶体管、电阻器及电容;位于每个通道中的输出神经元组,每个通道中的每个输入神经元组耦接到每个通道中的每个输出神经元组,其中所述输出神经元组包括无源电子组件和有源电子组件,该无源电子组件和该有源电子组件包括晶体管、电阻器及电容;和位于每个通道中的奖赏神经元组,其中每个奖赏神经元组接收来自环境输入的输入,并且其中每个通道的奖赏神经元只耦接到奖赏神经元所属的通道中的输出神经元,并且其中所述奖赏神经元包括无源电子组件和有源电子组件,该无源电子组件和该有源电子组件包括晶体管、电阻器及电容;其中,当通道的环境输入是正的时,相应通道的输出神经元被奖赏并具有增强的响应;其中,当通道的环境输入是负的时,相应通道的输出神经元被惩罚并具有衰减的响应。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于HRL实验室有限责任公司,未经HRL实验室有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201380063033.4/,转载请声明来源钻瓜专利网。