[发明专利]一种利用动态场景内交互作用介质的未来预测方法在审
申请号: | 201710487508.2 | 申请日: | 2017-06-23 |
公开(公告)号: | CN107274029A | 公开(公告)日: | 2017-10-20 |
发明(设计)人: | 夏春秋 | 申请(专利权)人: | 深圳市唯特视科技有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06N3/02 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518057 广东省深圳市高新技术产业园*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 利用 动态 场景 交互作用 介质 未来 预测 方法 | ||
技术领域
本发明涉及动作预测领域,尤其是涉及了一种利用动态场景内交互作用介质的未来预测方法。
背景技术
根据过往行为轨迹进行来预测未来该场景对此轨迹的响应,即未来事件预测,是近年来吸引极大关注的议题。在大数据日益流行的背景下,人机交互、机器人导航等会遇见许多前所未有的场景,运用未来预测方法,可极大程度训练智能设备进行当前场景与任务的实时分配与实施,同时对于任务量巨大的领域,如人群监控、资源勘探等具备硬件设施的场景将会有极高的应用潜力,此外,在多任务指挥系统分布协调、多种交通工具防撞应急措施、自然灾害逃生线路预警管理等方面也有不可估量的人文及市场价值。
未来预测仍然是一个很高难度的挑战性问题。由于任务中涉及的场景既包含视觉上的维度,也包含了逻辑上的考量,同时还赋予这个任务智能识别的功能,需要极高数据量的训练测试过程。一方面,时空不恒定性给视觉接收造成了模糊影响,同时数据量的负责程度导致的计算量增大会导致实时效果的降低,另一方面,太多相互作用的介质产生相互影响,无法一一剥离进行定量分析,因此对动作的预测判断造成了难度。
本发明提出了一种基于逆向最优控制的长期有利决策新框架。首先使用条件变分自编码器来生成假设预测的多样本,接着利用基于逆向最优控制框架的长期有利决策方法进行样本的评分排序及完善处理,引入循环神经网络对图像环境、活动的介质进行场景融合,得到的结果再反馈到解码器中进行迭代。本发明可以处理动态或者静态的场景中某一介质的未来事件预测活动,提供一个循环神经网络集合来生成、排序和改善样本,显著地取得预测的精确效果。
发明内容
针对解决在复杂场景多相互作用介质中预测未来动作的问题,本发明的目的在于提供一种利用动态场景内交互作用介质的未来预测方法,提出了一种基于逆向最优控制的长期有利决策新框架。
为解决上述问题,本发明提供一种利用动态场景内交互作用介质的未来预测方法,其主要内容包括:
(一)多样本生成;
(二)样本排序与完善;
(三)场景融合。
其中,所述的多样本生成,包括一般模型构造和条件变分自编码器。
进一步地,所述的一般模型构造,对于某场景内在发生事件中起交互作用的物体,不管静止或者运动,称之为介质,如果给定n个介质,它们的过往行动轨迹X=<X1,X2,…,Xn>,计算出它们的未来行为轨迹Y=<Y1,Y2,…,Yn>的各自概率则为P<Y|X,I>,特别地,I为该场景下一刻的输入,依照输入得到的最大概率输出作为预测轨迹。
进一步地,所述的条件变分自编码器,利用深度生成模型来学习一个决策函数f,该函数将过往行动轨迹X和输入I映射到未来行为轨迹Y上,具体地:
(1)引入随机潜变量zi,在输入Xi的条件下,学习到输出Yi的概率分布为P(Yi|Xi),此过程搭建相应的神经网络分别为识别网络Qφ(zi|Yi,Xi)、条件先验网络Pv(zi|Xi)以及生成网络Pθ(Yi|Xi,zi);
(2)在训练阶段:①分别用两个循环神经网络对介质i、Xi和Yi进行编码,得到两个结果②将这两个结果合并再传递到一层使用非线性激活函数的全连接网络;③再用并行的两个全连接网络生成关于zi的均值和标准差依其建模成高斯分布模型,并且用KL散度进行归一化处理;④提出两个损失函数对自编码器调整,分别为重建损失函数和KL散度损失函数lKLD=DKL(Qφ(zi|Yi,Xi)||Pv(zi));
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市唯特视科技有限公司,未经深圳市唯特视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710487508.2/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理