[发明专利]一种任务时序逻辑约束的概率规划识别方法有效

专利信息
申请号: 201811599707.3 申请日: 2018-12-26
公开(公告)号: CN109657868B 公开(公告)日: 2021-02-09
发明(设计)人: 方浩;宇文涛;陈杰;田戴荧;刘得明 申请(专利权)人: 北京理工大学
主分类号: G06Q10/04 分类号: G06Q10/04
代理公司: 北京理工大学专利中心 11120 代理人: 李微微;仇蕾安
地址: 100081 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 任务 时序 逻辑 约束 概率 规划 识别 方法
【权利要求书】:

1.一种任务时序逻辑约束的概率规划识别方法,其特征在于,包括如下步骤:

步骤一,建立面向实际环境的时序逻辑任务模型:利用有限状态转移系统对实际环境建模,再利用线性时序逻辑语言对任务进行描述并转换成对应Büchi自动机,将两者相结合建立同时具有环境信息和任务信息的乘积式Büchi自动机;将任务集中的所有任务建立形成对应乘积式Büchi自动机,组成规划库;

步骤二,根据对目标智能体的观测信息和规划库信息,综合考虑智能体当前位置、姿态、历史轨迹以及任务进程,基于Dijkstra算法设计规划器,并得出规划结果集和整体代价集,其中,智能体的姿态计算以智能体与目标点的朝向角为基准;

步骤三,将规划和规划识别相结合形成统一的整体,对于非合作智能体的未来目标和当前执行任务进行预测和辨识,提取规划器的规划结果集中反映的目标和任务,以规划器的整体代价集为衡量标准,计算目标概率和任务概率;

其中,所述步骤三中,计算得到目标概率和任务概率后,得到预测目标准确率和辨识任务准确率,给出针对所设计概率规划识别算法的评价标准;

所述步骤一中,具体包括如下步骤:

(1)带权的有限状态转移系统:

针对智能体的实际环境建模问题,采用带权的有限状态转移系统WFTS进行描述,定义如下:

定义1.带权的有限状态转移系统(WFTS)由一个多元组组成:

Tc=(Π,→c0,AP,Lc,Wc)

其中:

Π={π12,...,πN}表示栅格化后实际环境的各个区域;

c:表示两两栅格区域之间的路径连通关系;

Π0:表示智能体在初始时刻的实际位置;

AP:表示描述不可再划分任务的原子命题;

Lc:表示栅格区域对应的标签函数,即栅格区域对应的任务原子命题的属性;

Wc:表示权重,即智能体在栅格区域之间互相转移所需的代价;

状态πi可到达的状态表示为Post(πi)={πj∈Π|πicπj};将待观察目标智能体的移动轨迹用一个无穷状态序列表示,τ=π1→π2...,其中,πi∈Post(πi-1);

(2)非确定性Büchi自动机:

利用线性时序逻辑LTL语言对原子命题AP进行描述,形成表达式相对于表达式存在一个与其对应的非确定性Büchi自动机NBA,记为

定义2.定义为五元组:

其中,Q表示由自动机中的各个状态q1,q2,...,qn组成的有限状态集合;表示由自动机中的初始状态组成的初始状态集合;2AP表示由任务原子命题组成的字母表;δ表示自动机中各状态之间的转移关系,表示由自动机中的可接受状态组成的可接受集合;

(3)利用LTL语言对每个待辨识任务进行描述,并转换成相应Büchi自动机;将WFTS和NBA相结合形成面向实际环境的时序逻辑任务模型:

定义3.带权的乘积式Büchi自动机PBA表示为其中:

δ'=Q'→2Q'j,qn∈δ'(πi,qm)当且仅当(πij)∈→c并且qn∈δ(qm,Lci));

Q0'={π,q|π∈Π0,q∈Q0},是初始状态集;

F'={π,q|π∈Π0,q∈F},是可接受集;

Wp:是权重函数:

Wpi,qmj,qn)=Wcij)

其中πj,qn∈δ'(πi,qm);

所述步骤二具体步骤包括:

定义4.针对时序逻辑任务的规划问题定义为Pl={Apc,Qc,Rs},其中,Ap表示任务对应的乘积式自动机,πc表示智能体的当前位置,Qc表示当前时刻智能体可能对应的自动机中的状态集,Rs表示以q′c∈Q′c为起始点的Ap的所有可接受序列组成的集合,

根据定义4,设定可接受序列的结构为:

R=Rpre,Rsuf=q'cq'c+1…q'f[q'fq'f+1…q'n]

其中qf'=πf,qf∈F';

定义整体代价:

式中,第一个累加部分表示沿前缀部分的累积,第一个累加部分表示沿后缀部分的累积;γ≥0是一个常数,表示前缀代价与后缀代价的相对权重系数;

定义5.针对时序逻辑任务的概率规划识别问题定义为Pr={Apc,Qc,Rs,Os,Gs,Ps},其中:

Os表示智能体的历史移动轨迹;

表示目标概率集,表示智能体下一步目标是πi的概率,Πg表示待预测目标集;

表示任务概率集,表示当前执行任务是的概率,表示所有任务的集合;

当构建完成Ap之后,以Ap作为输入参数,计算可接受序列集Rs,获取多种规划路径;使用Dijkstra算法,计算带权图中从单点出发到一组目标点的路径,具体步骤如下:

①对于用线性时序逻辑语言描述的任务集将其中每个任务转换成对应Büchi自动机利用FTS对目标智能体工作环境建模形成Tc,并确定待预测目标集Πg;利用PBA对和Tc进行乘积操作构成并建立规划库

②通过观测获取目标智能体历史移动轨迹Os=π0,...,πc,对于πi,0≤i<c,有;

当i=c时,πc表示目标智能体当前位置信息,有:

③考虑历史移动轨迹Os的影响:

1)、令i=1

2)、对于q′i∈Q′i,如果则保留q′i;否则,将q′i从集合Q′i中删除;

3)、i=i+1

4)、判断i>c是否成立:如果成立,结束步骤3),得到经过处理后Q′c;否则返回2);

④使用Dijkstra算法计算从当前状态q′c∈Q′c到一个可接受状态的最短路径,是的可接受状态集,记为

⑤使用Dijkstra算法计算中每一个可接受状态回到自身的最短循环路径,记为

⑥对于定义:

定义规划结果序列中第一个属于待识别目标集Πg的πi为下的智能体下一步目标,记为

规划器根据观测所得目标智能体的信息,计算出符合实际环境和任务集的规划结果集Rsum为:

根据所得规划结果集Rsum,得出智能体下一步目标集Πgsum为:

根据整体代价R计算公式得到的整体代价整体代价集Costsum为:

其中,在设计规划器过程中,考虑智能体朝向与目标之间夹角的影响,则令Xi表示第i时刻智能体X的位置,朝向由表示,则在第i时刻,智能体X朝向与目标A之间的夹角为:

所述步骤四具体包括如下步骤:

①对作处理,定义:

其中,exp{x}表示ex,是正则化惩罚系数,由智能体姿态决定,λ是常数,

②在规划结果集Rsum中,将所有规划目标为πk且任务为的规划结果对应的整体代价相加,得到:

将所有规划目标任务为的规划结果对应的整体代价相加,得到:

将规划结果集所有规划对应的整体代价相加,有:

③针对目标智能体当前执行任务的辨识,根据观测轨迹Os计算任务集Φ中的任务概率规划结果集中符合的整体代价所占比重,即为后验概率

首先,假设任务集Φ中的任务相互独立,计算在任务的情况下,目标为πk的后验概率

之后,根据观测轨迹Os计算待预测目标集Πg中的目标概率即后验概率P(πk|Os):

2.如权利要求1所述的一种任务时序逻辑约束的概率规划识别方法,其特征在于,还包括对预测目标准确率和辨识任务准确率的计算,具体为:

智能体的实际目标集为Gtrue(i)={gt(0),...,~gt(i)},预测目标集为Gpred(i)={max(Gs(0)),...,max(Gs(i))},其中,gt(i),max(Gs(i))分别表示第i时刻智能体的实际目标和预测目标概率最大的目标,gt(i),max(Gs(i))∈Πg;智能体的实际执行任务集为预测执行任务集为Φpred(i)={max(Ps(0)),...,max(Ps(i))},其中,max(Ps(i))表示第i时刻智能体的实际执行任务和预测任务概率最大的任务,max(Ps(i))∈Φ;

第i时刻,目标预测准确率GA(i)为:

GA(i)=plen(Gtrue(i)∩Gpred(i))/len(Gtrue(i))

其中,len(G)表示集合G的长度;

第i时刻,任务辨识准确率TA(i)为

TA(i)=len(Φtrue(i)∩Φpred(i))/len(Φtrue(i))。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811599707.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top