[发明专利]一种城市公共地图用户访问量差异因素分析方法有效
申请号: | 201810115237.2 | 申请日: | 2018-02-06 |
公开(公告)号: | CN108428205B | 公开(公告)日: | 2022-02-01 |
发明(设计)人: | 李锐;杨宁;李茹 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06Q50/26 | 分类号: | G06Q50/26;G06Q30/02 |
代理公司: | 湖北武汉永嘉专利代理有限公司 42102 | 代理人: | 唐万荣;李丹 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 城市 公共 地图 用户 访问量 差异 因素 分析 方法 | ||
1.一种城市公共地图用户访问量差异因素分析方法,其特征在于,包括以下步骤:
1)研究对象的选取与数据采集:采用Hadoop云技术框架,对海量公共地图访问日志数据进行处理,基于IP地址快速解析地图用户所在城市信息,获得各城市公共地图用户访问量数据;
2)确定影响因素与解释变量;所述影响因素包括城市规模、该城市的人口质量、经济水平、公共交通发展水平和公共服务业发展水平;所述解释变量包括对应城市规模的城市的面积x1与人口数量x2;对应人口质量的人均受教育年限x3和18至40岁人口占比x4;对应经济水平的人均GDP x5;对应公共交通发展水平的日均客运量x6、地铁站数量x7、公交站数量x8、停车场数量x9和加油站数量x10;对应公共服务业发展水平的餐饮店数量x11、旅游景点数量x12、酒店数量x13和金融设施数量x14;
3)采用z-score标准化方法,对数据进行标准化处理,使所有数据处于同一量纲之下,然后去除数据的单位限制,将所有数据转化为无量纲的纯数值,并得到用户访问量的数据矩阵和解释变量数据矩阵;
所述数据包括步骤1)中的选取n个城市的用户访问量数据和步骤2)中的解释变量数据;
所述数据矩阵的形成方法如下:假设有m个城市公共地图用户访问量的解释变量,作为函数自变量;选取n个城市的用户访问量,作为样本点;因变量为城市公共地图用户访问量,则用户访问量的数据矩阵是一个n*1矩阵,解释变量的数据矩阵是一个n*m矩阵;利用z-score标准化方法,将进行标准化处理后的用户访问量数据矩阵记为F0,标准化处理后的解释变量数据矩阵记为E0;
4)利用主成分分析法对解释变量矩阵E0进行成分提取,并根据交叉有效性原则确定提取的解释变量成分个数h,使得主成分既能代表解释变量矩阵E0的变异信息,又能使解释变量矩阵E0与用户访问量矩阵F0的相关程度达到最大,并确定用户访问量矩阵F0与h个解释变量成分之间的偏最小二乘回归方程;
5)根据偏最小二乘回归分析,求取各个解释变量的变量重要性指标,用以定量化比较各个解释变量对城市公共地图用户访问量的贡献程度。
2.根据权利要求1所述的城市公共地图用户访问量差异因素分析方法,其特征在于,所述步骤1)中选取的城市公共地图用户访问量数据为对城市进行访问量排序,依据排序结果选择访问量排名前28的城市作为公共地图用户访问量的研究对象。
3.根据权利要求1所述的城市公共地图用户访问量差异因素分析方法,其特征在于,所述步骤3)中标准化处理后的用户访问量数据矩阵F0和标准化处理后的解释变量数据矩阵E0如下:
其中,E(y)表示各城市公共地图用户访问量Y的平均值,SY为Y的标准差,E(xi)为第i个解释变量xi的均值,i=1,2,3,…,m,为解释变量xi的标准差,E0m指示第m个解释变量在n个城市中值的分布。
4.根据权利要求1所述的城市公共地图用户访问量差异因素分析方法,其特征在于,所述步骤4)具体如下:
4.1)按照如下公式(3),从解释变量矩阵E0中提取第一个解释变量主成分t1,即t1是解释变量xi,的线性组合,i=1,2,…,m;依据公式(4)从访问量矩阵F0中提取第一个主成分u1,
t1=E0w1 (3)
u1=F0c1 (4)
其中,w1为E0的第一个轴,‖w1‖=1;c1是F0的第一个轴,并且‖c1‖=1;t1,u1包含着解释变量与用户访问量进行标准化后的数据信息,并且要求解释变量的成分t1最大程度的解释用户访问量的成分u1;
要求t1与u1之间的协方差最大;
在公式(5)中,θ1是优化的目标函数,w1是的特征向量,是与其对应的特征值,c1为与的最大特征值对应的单位特征向量;此处,c1=1,则u1=F0;
w1和t1的计算方式分别如公式(6),(7)所示:
其中,r(xi,y)为解释变量xi和用户访问量y之间的相关系数;在得到w1之后,根据公式(7)可计算出解释变量矩阵E0的第一个成分t1,并据此得到解释变量矩阵E0、访问量矩阵F0对t1的回归方程:
F0=t1r1+F1 (9)
其中,P1和r1均为回归系数,前者为向量,后者是标量;E1,F1分别是方程(8)和(9)中E0和F0的残差矩阵;
4.2)利用步骤4.1)中的偏最小二乘的成分提取方法,根据交叉有效性原则,共从解释变量矩阵E0中提取h个主成分:t1,…,th;则所求用户访问量矩阵F0在t1,…,th上的偏最小二乘回归方程为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810115237.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种智慧教育服务平台
- 下一篇:一种图书上书还架方法