[发明专利]自治操作条件反射自动机及在实现智能行为中的应用无效
申请号: | 200910089263.3 | 申请日: | 2009-07-15 |
公开(公告)号: | CN101599137A | 公开(公告)日: | 2009-12-09 |
发明(设计)人: | 阮晓钢;戴丽珍;蔡建羡;陈静;郜园园 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06N3/00 | 分类号: | G06N3/00 |
代理公司: | 北京思海天达知识产权代理有限公司 | 代理人: | 刘 萍 |
地址: | 100124*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 自治操作条件反射自动机及在实现智能行为中的应用属于仿生领域。一种自治操作条件反射自动机AOC涉及一种描述自治式自动机器的离散计算机模型,主要包括:操作集合、状态集合、“条件-操作”规则集合、可观测的状态转移,以及操作条件反射学习律,并且,定义了基于AOC状态取向值的行为熵,规定了AOC的递归运行程序。AOC的重要特征在于模拟生物的操作条件反射机制,因而具有仿生的自组织功能,包括自学习和自适应功能,可用于描述,模拟,设计各种自组织系统,特别地,应将其应用于描述,模拟,设计机器人系统的各种智能行为。 | ||
搜索关键词: | 自治 操作 条件反射 自动机 实现 智能 行为 中的 应用 | ||
【主权项】:
1、一种自治操作条件反射自动机,以下简称AOC是一个九元组:AOC = < t , Ω , S , Γ , δ , ϵ , η , ψ , s 0 > ]]> 其中(1)AOC的离散时间:t∈{0,1,2,…,nt},t=0为AOC的起始时刻;(2)AOC的操作符号集合:Ω={αk|k=1,2,…,nΩ},αk为AOC的第k个操作符号;(3)AOC的状态集合:S={si|i=0,1,2,…,nS},si为AOC的第i个状态;(4)AOC的操作规则集合:Γ={rik(p)|p∈P;i∈{0,1,2,…,nS};k∈{0,1,2,…,nΩ}},随机“条件-操作”规则rik(p):si→αk(p)意味着AOC在其状态处于si∈S的条件下依概率p∈P实施操作αk∈Ω,p=pik=p(αk|si)即AOC在状态处于si的条件下实施操作αk的概率值,P表示pik的集合;(5)AOC的状态转移函数:δ:S(t)×Ω(t)→S(t+1),AOC t+1时刻的状态s(t+1)∈S由t时刻的状态s(t)∈S和t时刻的操作α(t)∈Ω确定,与其t时刻之前的状态和操作无关;δ所确定的状态转移过程是已知的或未知的,但其状态转移的结果是能够观测的;(6)AOC的取向函数:ε:S→E={εi|i=0,1,2,…,nS},εi=ε(si)∈E为状态si∈S的取向值;(7)AOC的操作条件反射学习律:模拟生物的操作条件反射机制,调节操作规则rik(p)∈Γ的实施概率,假设t时刻的状态为s(t)=si,实施操作α(t)=αk∈Ω,t+1时刻观测到的状态s(t+1)=sj,那么t+1时刻的操作概率依进行更新;这里其中,pik(t)是AOC状态处于si∈S的条件下实施操作αk∈Ω的概率在t时刻的值;pik(t+1)是AOC状态处于si∈S的条件下实施操作αk∈Ω的概率在t+1时刻的值;并且0≤pik+Δ≤1;ϵ → ij = ϵ ( s j ) - ϵ ( s i ) ]]> 即取向值的增量;是单调增函数,满足当且仅当x=0;a是学习率;ξ = p iu ( t ) / Σ v ≠ k p iv ( t ) , ]]> 这里u表示0到nΩ之间不等于k的任何一个数值,表示AOC状态处于si∈S的条件下实施操作αu∈Ω的概率之和在t时刻的值,v表示0到nΩ之间不等于k的所有数值;piu(t)是AOC状态处于si∈S的条件下实施操作αu∈Ω的概率在t时刻的值,piu(t+1)是AOC状态处于si∈S的条件下实施操作αu∈Ω的概率在t+1时刻的值;(8)AOC的操作熵:ψ:P×E→R+,R+是正的实数集,AOC在t时刻的操作熵ψ(t)表示t时刻状态处于si条件下的操作熵之和:ψ ( t ) = ψ ( Ω ( t ) | S ) = Σ i = 0 n S p i ψ i ( t ) = Σ i = 0 n S p ( s i ) ψ i ( Ω ( t ) | s i ) ]]> 它由t时刻处于状态s(t)=si条件下的操作概率集合和取向函数集合决定;ψi(t)是AOC处于状态si条件下的操作熵:ψ i ( t ) = ψ i ( Ω ( t ) | s i ) = - Σ k = 1 n Ω p ik log 2 p ik = - Σ k = 1 n Ω p ( α k | s i ) log 2 p ( α k | s i ) ]]> 知道每个状态下的操作熵并加权求和就可以得出AOC在t时刻的操作熵ψ ( t ) = - Σ i = 0 n S p i Σ k = 1 n Ω p ik log 2 p ik = - Σ i = 0 n S p ( s i ) Σ k = 1 n Ω p ( α k | s i ) log 2 p ( α k | s i ) ; ]]> 其中,p(si)是AOC状态si∈S的出现概率在t时刻的值,p(αk|si)是AOC状态处于si∈S的条件下实施操作αk∈Ω的概率在t时刻的值;(9)AOC的起始状态:s0=s(0)∈S。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200910089263.3/,转载请声明来源钻瓜专利网。
- 上一篇:塑料箩筐底下滑轮装置
- 下一篇:台式书籍消毒器