[发明专利]一种任务时序逻辑约束的概率规划识别方法有效
申请号: | 201811599707.3 | 申请日: | 2018-12-26 |
公开(公告)号: | CN109657868B | 公开(公告)日: | 2021-02-09 |
发明(设计)人: | 方浩;宇文涛;陈杰;田戴荧;刘得明 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04 |
代理公司: | 北京理工大学专利中心 11120 | 代理人: | 李微微;仇蕾安 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 任务 时序 逻辑 约束 概率 规划 识别 方法 | ||
1.一种任务时序逻辑约束的概率规划识别方法,其特征在于,包括如下步骤:
步骤一,建立面向实际环境的时序逻辑任务模型:利用有限状态转移系统对实际环境建模,再利用线性时序逻辑语言对任务进行描述并转换成对应Büchi自动机,将两者相结合建立同时具有环境信息和任务信息的乘积式Büchi自动机;将任务集中的所有任务建立形成对应乘积式Büchi自动机,组成规划库;
步骤二,根据对目标智能体的观测信息和规划库信息,综合考虑智能体当前位置、姿态、历史轨迹以及任务进程,基于Dijkstra算法设计规划器,并得出规划结果集和整体代价集,其中,智能体的姿态计算以智能体与目标点的朝向角为基准;
步骤三,将规划和规划识别相结合形成统一的整体,对于非合作智能体的未来目标和当前执行任务进行预测和辨识,提取规划器的规划结果集中反映的目标和任务,以规划器的整体代价集为衡量标准,计算目标概率和任务概率;
其中,所述步骤三中,计算得到目标概率和任务概率后,得到预测目标准确率和辨识任务准确率,给出针对所设计概率规划识别算法的评价标准;
所述步骤一中,具体包括如下步骤:
(1)带权的有限状态转移系统:
针对智能体的实际环境建模问题,采用带权的有限状态转移系统WFTS进行描述,定义如下:
定义1.带权的有限状态转移系统(WFTS)由一个多元组组成:
Tc=(Π,→c,Π0,AP,Lc,Wc)
其中:
Π={π1,π2,...,πN}表示栅格化后实际环境的各个区域;
→c:表示两两栅格区域之间的路径连通关系;
Π0:表示智能体在初始时刻的实际位置;
AP:表示描述不可再划分任务的原子命题;
Lc:表示栅格区域对应的标签函数,即栅格区域对应的任务原子命题的属性;
Wc:表示权重,即智能体在栅格区域之间互相转移所需的代价;
状态πi可到达的状态表示为Post(πi)={πj∈Π|πi→cπj};将待观察目标智能体的移动轨迹用一个无穷状态序列表示,τ=π1→π2...,其中,πi∈Post(πi-1);
(2)非确定性Büchi自动机:
利用线性时序逻辑LTL语言对原子命题AP进行描述,形成表达式相对于表达式存在一个与其对应的非确定性Büchi自动机NBA,记为
定义2.定义为五元组:
其中,Q表示由自动机中的各个状态q1,q2,...,qn组成的有限状态集合;表示由自动机中的初始状态组成的初始状态集合;2AP表示由任务原子命题组成的字母表;δ表示自动机中各状态之间的转移关系,表示由自动机中的可接受状态组成的可接受集合;
(3)利用LTL语言对每个待辨识任务进行描述,并转换成相应Büchi自动机;将WFTS和NBA相结合形成面向实际环境的时序逻辑任务模型:
定义3.带权的乘积式Büchi自动机PBA表示为其中:
δ'=Q'→2Q'.πj,qn∈δ'(πi,qm)当且仅当(πi,πj)∈→c并且qn∈δ(qm,Lc(πi));
Q0'={π,q|π∈Π0,q∈Q0},是初始状态集;
F'={π,q|π∈Π0,q∈F},是可接受集;
Wp:是权重函数:
Wp(πi,qm,πj,qn)=Wc(πi,πj)
其中πj,qn∈δ'(πi,qm);
所述步骤二具体步骤包括:
定义4.针对时序逻辑任务的规划问题定义为Pl={Ap,πc,Qc,Rs},其中,Ap表示任务对应的乘积式自动机,πc表示智能体的当前位置,Qc表示当前时刻智能体可能对应的自动机中的状态集,Rs表示以q′c∈Q′c为起始点的Ap的所有可接受序列组成的集合,
根据定义4,设定可接受序列的结构为:
R=Rpre,Rsuf=q'cq'c+1…q'f[q'fq'f+1…q'n]
其中qf'=πf,qf∈F';
定义整体代价:
式中,第一个累加部分表示沿前缀部分的累积,第一个累加部分表示沿后缀部分的累积;γ≥0是一个常数,表示前缀代价与后缀代价的相对权重系数;
定义5.针对时序逻辑任务的概率规划识别问题定义为Pr={Ap,πc,Qc,Rs,Os,Gs,Ps},其中:
Os表示智能体的历史移动轨迹;
表示目标概率集,表示智能体下一步目标是πi的概率,Πg表示待预测目标集;
表示任务概率集,表示当前执行任务是的概率,表示所有任务的集合;
当构建完成Ap之后,以Ap作为输入参数,计算可接受序列集Rs,获取多种规划路径;使用Dijkstra算法,计算带权图中从单点出发到一组目标点的路径,具体步骤如下:
①对于用线性时序逻辑语言描述的任务集将其中每个任务转换成对应Büchi自动机利用FTS对目标智能体工作环境建模形成Tc,并确定待预测目标集Πg;利用PBA对和Tc进行乘积操作构成并建立规划库
②通过观测获取目标智能体历史移动轨迹Os=π0,...,πc,对于πi,0≤i<c,有;
当i=c时,πc表示目标智能体当前位置信息,有:
③考虑历史移动轨迹Os的影响:
1)、令i=1
2)、对于q′i∈Q′i,如果则保留q′i;否则,将q′i从集合Q′i中删除;
3)、i=i+1
4)、判断i>c是否成立:如果成立,结束步骤3),得到经过处理后Q′c;否则返回2);
④使用Dijkstra算法计算从当前状态q′c∈Q′c到一个可接受状态的最短路径,是的可接受状态集,记为
⑤使用Dijkstra算法计算中每一个可接受状态回到自身的最短循环路径,记为
⑥对于定义:
定义规划结果序列中第一个属于待识别目标集Πg的πi为下的智能体下一步目标,记为
规划器根据观测所得目标智能体的信息,计算出符合实际环境和任务集的规划结果集Rsum为:
根据所得规划结果集Rsum,得出智能体下一步目标集Πgsum为:
根据整体代价R计算公式得到的整体代价整体代价集Costsum为:
其中,在设计规划器过程中,考虑智能体朝向与目标之间夹角的影响,则令Xi表示第i时刻智能体X的位置,朝向由表示,则在第i时刻,智能体X朝向与目标A之间的夹角为:
所述步骤四具体包括如下步骤:
①对作处理,定义:
其中,exp{x}表示ex,是正则化惩罚系数,由智能体姿态决定,λ是常数,
②在规划结果集Rsum中,将所有规划目标为πk且任务为的规划结果对应的整体代价相加,得到:
将所有规划目标任务为的规划结果对应的整体代价相加,得到:
将规划结果集所有规划对应的整体代价相加,有:
③针对目标智能体当前执行任务的辨识,根据观测轨迹Os计算任务集Φ中的任务概率规划结果集中符合的整体代价所占比重,即为后验概率
首先,假设任务集Φ中的任务相互独立,计算在任务的情况下,目标为πk的后验概率
之后,根据观测轨迹Os计算待预测目标集Πg中的目标概率即后验概率P(πk|Os):
2.如权利要求1所述的一种任务时序逻辑约束的概率规划识别方法,其特征在于,还包括对预测目标准确率和辨识任务准确率的计算,具体为:
智能体的实际目标集为Gtrue(i)={gt(0),...,~gt(i)},预测目标集为Gpred(i)={max(Gs(0)),...,max(Gs(i))},其中,gt(i),max(Gs(i))分别表示第i时刻智能体的实际目标和预测目标概率最大的目标,gt(i),max(Gs(i))∈Πg;智能体的实际执行任务集为预测执行任务集为Φpred(i)={max(Ps(0)),...,max(Ps(i))},其中,max(Ps(i))表示第i时刻智能体的实际执行任务和预测任务概率最大的任务,max(Ps(i))∈Φ;
第i时刻,目标预测准确率GA(i)为:
GA(i)=plen(Gtrue(i)∩Gpred(i))/len(Gtrue(i))
其中,len(G)表示集合G的长度;
第i时刻,任务辨识准确率TA(i)为
TA(i)=len(Φtrue(i)∩Φpred(i))/len(Φtrue(i))。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811599707.3/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理