[发明专利]基于输出状态限制的循环神经网络轨迹似然概率计算方法有效
申请号: | 201710665944.4 | 申请日: | 2017-08-07 |
公开(公告)号: | CN107480786B | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 孙未未;吴昊 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06N3/08 | 分类号: | G06N3/08 |
代理公司: | 上海正旦专利代理有限公司 31200 | 代理人: | 陆飞;陆尤 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 输出 状态 限制 循环 神经网络 轨迹 概率 计算方法 | ||
本发明属于轨迹计算技术领域,具体为一种基于输出状态限制的循环神经网络轨迹似然概率计算方法。本发明方法的步骤包括:训练阶段,利用输出状态限制的循环神经网络对轨迹进行建模,根据历史轨迹数据训练模型参数;在线查询阶段,根据已训练好的模型对输入的轨迹的每个路段预测转移到下一个路段的概率。本发明利用深度神经网络的强大的表达能力,可以学习到基于马尔可夫模型所无法捕捉到的长距离依赖关系,从而更准确地对轨迹数据进行建模。
技术领域
本发明属于轨迹计算技术领域,具体涉及一种基于输出状态限制的循环神经网络轨迹似然概率的计算方法。
背景技术
移动端GPS设备的普及推动了基于位置的服务的发展,轨迹计算也应运而生。随着大量轨迹数据的获得,从而使得对这些轨迹数据建立一个概率模型得到了可能。轨迹模型是轨迹计算中的一个非常重要且基础的问题。对轨迹进行概率建模,能够帮助解决路径推荐、路况预计、轨迹预测、频繁模式挖掘、异常检测等与行驶路径有关的应用问题,具有非常大的应用场景。现有的轨迹概率建模技术主要分为基于马尔可夫链的模型与基于反向增强学习的模型两类:
(1)基于马尔可夫链的模型:
大量的已有工作都使用了马尔可夫链对一条轨迹进行概率建模,也就是说,这些工作假定轨迹之间的路段转换符合马尔可夫性,即,当前路段转移至下一个路段的这个事件与更先前经过的路段是无关的。很显然,这种假设虽然能简化问题,但是也同时损失了建模的准确性。基于马尔可夫链的模型,无法捕捉到轨迹数据中长间隔的依赖关系。
(2)基于反向增强学习的模型
还有一些工作使用了反向增强学习的模型对轨迹进行概率建模,这些方法的主要问题在于,使用马尔可夫决策过程进行建模并使用反向增强学习的模型,虽然能捕捉到未来的信息,但是仍然无法摆脱马尔可夫性;使用最大熵反向增强学习的模型,虽然能够捕捉到长距离的依赖关系,但是由于模型本身参数过少,导致模型表达能力不强,而受到了制约。
发明内容
本发明的目的在于针对现有技术的不足,提出一种可以捕捉长距离下的依赖关系的具有强大表达能力的循环神经网络轨迹似然概率的计算方法。
本发明提出的循环神经网络轨迹似然概率的计算方法,是基于输出状态限制的,包括训练阶段和在线查询阶段,具体步骤如下:
(一)训练阶段,利用马尔可夫决策过程模型对轨迹进行建模,根据历史轨迹数据训练模型参数;具体流程为:
(1)构建循环神经网络,循环神经网络是一种特殊的神经网络,定义网络隐层节点数为H,输入向量的维度为I,所有隐层节点构成的向量称为隐层向量h,那么一个简单的单层循环神经网络的参数WN={Whh,Wxh,b},其中,是前一个时间片的隐层到当前时间片的隐层的权重矩阵,是网络输入层到隐层的权重矩阵,是偏置参数,。对于第1时刻的输入x1,循环神经网络的隐层向量其中,是维度为H的零向量。对于第t时刻的输入xt,对应的t时刻的网络隐层向量ht=σ(Wxhxt+Whhht-1+b),其中σ()为一个非线性的激活函数,通常使用双曲正切函数tanh或者纠正线性单元(Rectified Linear Unit,ReLu)。需要注明的是,循环神经网络有多重变种形式,这些变种的循环神经网络也是可以合法的应用在本发明中的,包括深度循环神经网络(DeepRecurrent Neural Network),门循环单元网络(Gated Recurrent Unit,GRU),长短期记忆1神经网络(Long-Short Term Memory,LSTM)等,由于这些结构都属于已有发明,故不做详细阐述。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710665944.4/2.html,转载请声明来源钻瓜专利网。