[发明专利]一种基于多源数据融合的公共自行车租借预测方法有效
申请号: | 201510154943.4 | 申请日: | 2015-04-02 |
公开(公告)号: | CN104778508B | 公开(公告)日: | 2017-12-08 |
发明(设计)人: | 林菲;范为迪;余日泰;徐海涛 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/30 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙)33240 | 代理人: | 黄前泽 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于多源数据融合的公共自行车租借预测方法。本发明首先将公共自行车租/还记录、天气、温度、节假日等历史数据经过数据清洗和预处理,获得训练数据集。使用聚类算法对数据集进行分类,划分公共自行车的不同租借模式;将分类后的数据集构建贝叶斯分类器,用于根据未来某天的节假日、天气、气温情况预测当天所属的租借模式;为不同模式的数据集分别训练各模式对应的自适应粒子群神经网络模型。最后,通过贝叶斯分类器预测某天的租借模式挑选对应的粒子群神经网络模型来预测公共自行车的租借规律。本发明预测精度高、运算速度快,能够为用户租还车提供参考依据,减少公共自行车站点不平衡状态持续时间,提高用户满意度。 | ||
搜索关键词: | 一种 基于 数据 融合 公共 自行车 租借 预测 方法 | ||
【主权项】:
一种基于多源数据融合的公共自行车租借预测方法,其特征在于包括如下步骤:步骤(1)数据采集与处理:读取公共自行车系统中存储的用户租车记录,计算每个站点每隔时间段time剩余公共自行车数量,针对每个站点建立向量Ndate=[n1,n2,...,nj,...,nM];从互联网上获取历史天气状况、气温和节假日情况,建立环境属性向量S={S1,S2,...,Si,...,SL},Si=[d,w,t],L为数据样本集中样本的个数;M、L、i和j均为正整数,其中j≤M,i≤L;所述的用户租车记录包括租借时间、租借站点、租借车桩号、还车时间、还车站点、还车车桩号;nj表示第j个时间段time该站点内剩余自行车数量;Si表示第i天的环境属性;d表示当天的节假日属性,d的取值为w表示天气状况,w的取值为t表示气温,t的取值为步骤(2)K‑means聚类:Ndate=[n1,n2,...,nj,...,nM]作为待分类的数据样本集中的一个数据元组;从数据样本集中随机选取k′个点作为初始类中心,分别用μ1,μ2,...,μk′表示类c1,c2,...,ck′的类中心;其中,k′为正整数;K‑means聚类算法包括如下步骤:2‑1.计算其余的数据元组Ni′与类中心μk′的距离,将其余的数据元组Ni′分到与其距离最短的类中;2‑2.重新计算各类的新的类中心μk′*;2‑3.重复步骤2‑1和步骤2‑2,直到各数据元组所属类别都不再变化;步骤(3)构建贝叶斯分类器:使用k‑means聚类算法对数据样本集进行分类后,得到k个类,数据样本集中的每个数据元组都将得到一个类标号;贝叶斯分类法基于贝叶斯定理:P(H|X)=P(X|H)P(H)P(X)]]>计算P(X),P(H)和P(X|H);步骤(4)自适应粒子群神经网络模型训练使用分类后的数据样本训练各类别所属的自适应粒子群神经网络模型,设定神经网络的输入层单元个数为n,隐含层单元个数为p,输出层单元个数为q;则神经网络中需要调整的权值个数N=n×p+p×q,用需要调整的权值个数N表示问题空间的维度;用向量Xi=[xi1,xi2,...,xiN]表示神经网络所有权值的一个可能取值,也表示粒子群优化算法中粒子的位置;粒子群神经网络模型训练步骤如下:4‑1.初始化粒子群种群中各粒子的位置和速度,粒子的位置和速度位于[0,1]之间,即随机生成G个向量Xi=[xi1,xi2,...,xiN],1≤i≤G作为粒子的位置,xiN介于[0,1]之间;再随机生成G个向量Vi=[vi1,vi2,...,viN],G+1≤i≤2×G作为粒子的速度,viN介于[0,1]之间;设定最大迭代次数itermax,当前迭代次数k=1;4‑2.计算各粒子的适应度值,存储各粒子当前的位置为自身最优值Pbi,存储所有粒子中适应度值最小的位置为全局最优值Pbg;4‑3.判断k是否达到最大迭代次数itermax,若是,转到步骤4‑7,否则转到4‑4;4‑4.更新各粒子速度和位置,计算各粒子新的适应度值;若第i个粒子的当前适应度值优于Pbi,则更新Pbi;若当前粒子群的最优位置优于Pbg,则更新Pbg;设置k=k+1;4‑5.根据惯性权重计算公式更新惯性权重;4‑6.若全局最优位置Pbg在10次迭代中没有变化,则转到步骤4‑7,否则转到步骤4‑4;4‑7.输出Pbg作为训练好的粒子群神经网络的权值;步骤(4)中使用的计算公式及变量含义如下:适应度值fitness(Xg)的计算公式为:fitness(Xg)=12M′Σl=1M′Σk=1q((Σj=1pwjk(1/(1+exp(Σi=1nwijxli-θhj)))-θok)-dlk)]]>M′为数据样本集中数据元组个数;xli为第l个数据样本的第i个输入;θhj为隐含层第j个单元的阈值;θok为输出层第k个单元的阈值;wij为第i个输入层与第j个隐含层的连接权值;wjk为第j个隐含层与第k个输出层的连接权值;dlk为第l个数据样本的第k个输出;速度计算公式为:Vik+1=w×Vik+c1×r1×(Pik-Xik)+c2×r2×(Pgk-Xik)]]>Vik为粒子Xi在第k次迭代的速度;r1,r2是取值在[0,1]之间的随机数;c1,c2为一组随机数,取c1=c2=2.5;ω为惯性权重;惯性权重ωk计算公式为:ωk=ωmax-ωmax-ωminitmax×k]]>ωmax=0.9,ωmin=0.2;粒子的位置计算公式为:Xik+1=Xik+Vik+1;]]>Xik为第k次迭代时第i个粒子的位置;步骤(5)租借模式预测:根据输入的待预测环境属性向量Spre和计算得到的P(H),P(X|H)的值,计算出该数据元组属于各类别的概率,输出后验概率最大的类别;步骤(6)公共自行车租借预测根据步骤(5)租借模式预测中输出的类别,选择相应的自适应粒子群神经网络模型,将前n′个时间段的剩余公共自行车数量输入该模型,输出即为预测的公共自行车数量。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510154943.4/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置