[发明专利]基于深度学习和大数据分析的出租车寻客策略推荐方法有效
申请号: | 201910641328.4 | 申请日: | 2019-07-16 |
公开(公告)号: | CN110348969B | 公开(公告)日: | 2022-04-08 |
发明(设计)人: | 王桐;孙博;张乐君;李升波 | 申请(专利权)人: | 哈尔滨工程大学 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06Q10/04;G06N3/04 |
代理公司: | 哈尔滨市阳光惠远知识产权代理有限公司 23211 | 代理人: | 刘景祥 |
地址: | 150001 黑龙江*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 数据 分析 出租车 策略 推荐 方法 | ||
1.基于深度学习和大数据分析的出租车寻客策略推荐方法,其特征在于,
所述推荐方法包括以下步骤:
步骤一:对出租车历史轨迹数据进行清洗;
步骤二:从经过清洗的出租车历史轨迹数据中提取出租车载客点;
步骤三:从提取出的出租车载客点中提取出租车载客热点;
步骤四:对出租车载客热点进行载客量预测;
步骤五:提出出租车推荐模型,
在步骤一中,具体的,对历史轨迹数据清洗包括:去除无效数据、去除无用字段、去除非本市数据、去除重复数据;
在步骤二中包括:
步骤二一:将出租车历史轨迹数据上传到Hadoop集群;
步骤二二:加载清洗过的历史轨迹数据,利用Spark的map函数将数据映射成以出租车编号为主键,其他字段为值的RDD对象;
步骤二三:使用Spark平台的groupByKey方法将具有相同主键的元素汇集到一个集合里;
步骤二四:使用sort方法对RDD中每个元素的值按照时间字段进行排序;
步骤二五:筛选出出租车载客状态由0变到10000000的数据;
在步骤三中,采用基于密度的DBSCAN聚类算法寻找热点,DBSCAN包含两个重要的参数:最小包含点数minPts和扫描半径eps,分别设置最小包含点数和扫描半径;
在步骤四中,对出租车载客热点进行载客量预测运用了循环神经网络RNN,具体的,对隐藏层神经元的输入添加自身的返回值得到循环神经网络RNN,RNN隐藏层s和输出层o的输出为:
st=f(Uxt+Wst-1), (1)
ot=g(Vst), (2)
其中,t是时刻,x是输入层,s是隐藏层,o是输出层,矩阵W是隐藏层上一次的值作为本次的输入的权重,U和V均是权重矩阵,
RNN使用误差逆向传播算法来训练,第i层t时刻的误差值沿两个方向传播:
一个方向是传递到上一层网络,这部分只和权重矩阵U有关;
另一个方向是沿时间线通过递归传递到初始时刻,这部分和权重矩阵W有关;
在3层RNN的基础上加入Dropout层;
在步骤五中,具体的,用马尔可夫决策过程IMDP做出出租车推荐模型,具体的,所述马尔可夫决策过程IMDP表示为一个五元组(S,A,Psa,γ,Rsa),其中S是状态集合;A={等待,移动到下一热点},是司机在拾取点能够做的一系列动作;Psa为转移概率矩阵,通过数据挖掘得到,表示在状态Si∈S情况下进行动作a∈A转移到下一状态的概率;γ∈(0,1)为折扣因子;是在状态si∈S下采取行为a∈A后的回报,在当前热点做出选择后的代价为Cij=Eij,Eij为车辆从状态si到sj的空载时间,得到的回报记为其中,Xj为状态sj的预测上车人数,
出租车从状态集S中的一个状态s0开始,选择动作集A中的一个动作a0到达下一状态s1,在此状态下同样选择一个动作a1到达状态s2,这一过程被描述为:
在上述过程的影响下,定义回报函数为:
简写为:
R(s0)+γR(s1)+γ2R(s2)+…
采用策略π作为所有状态对应的策略集合,策略π是将状态映射到动作的函数,即π:S→A,在一个状态s下,选择动作a=π(s),
当采用策略π时,累积回报在状态s处的期望值定义为状态-值函数:
Vπ(s)=E[R(s0)+γR(s1)+γ2R(s2)+…∣s0=s] (3)
化为贝尔曼方程:
在式(4)中R(s)表示立刻回报,即在状态s处选择动作a可立即获得的回报,等式右侧第二项为求和项,表示在此选择下未来的回报,
定义最优状态-值函数为:
贝尔曼等式的形式为:
同样定义最优政策函数为:
由式(4)~(7)可知:
接下来利用策略迭代求解IMDP,具体步骤为:
步骤一:初始化所有状态的V(s)以及π(s),其中,初始化为随机策略;
步骤二:用当前的V(s)对当前策略进行评估,计算出每一个状态的V(s),直到V(s)收敛,才算训练好了这个状态价值函数V(s);
步骤三:用上一步得到的当前策略评估函数V(s)进行改进,在每个状态s时,对每个可能的动作a,计算采取这个动作后到达下一状态的期望价值,选取使达到下一状态的期望价值函数最大的动作来更新策略π(s),然后再次循环步骤一和步骤二,直到V(s)和π(s)全部收敛,最终得到出租车推荐模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910641328.4/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置