[发明专利]一种对网页信息展示位置进行排序的方法有效
申请号: | 201710090028.2 | 申请日: | 2017-02-20 |
公开(公告)号: | CN106919669B | 公开(公告)日: | 2020-07-14 |
发明(设计)人: | 周伟华;周云 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F16/954 | 分类号: | G06F16/954;G06F16/958 |
代理公司: | 杭州浙科专利事务所(普通合伙) 33213 | 代理人: | 沈渊琪 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网页 信息 展示 位置 进行 排序 方法 | ||
1.一种对网页信息展示位置进行排序的方法,其特征在于利用监控程序收集一定时间段、同一网页内不同展示位置的用户点击量数据,对收集的历史点击量进行数据净化,通过时间序列计算历史点击量期望值,根据期望值来估计展示位置的当前价值,再按照当前估计价值从高到低对网站不同的展示位置进行排序;
具体包括以下步骤:
1)数据获取:利用监控程序,监控各个展示位置的用户点击轨迹,收集和统计特定时间段、同一网页内各展示位置每天的用户点击量数据;
2)对原始数据进行清洗,得到“干净数据”;
3)计算在该时间段内各个展示位置点击量的期望值;
4)以点击量的期望值来估计展位当前价值,并对展示位置从高到低进行排序;
5)滚动排序,即在下一个排序周期,收集相同时间间隔的数据,重复1)到4)的步骤,实现周期性动态排序;
所述的步骤2)中对原始数据进行清洗包括如下步骤:
1)数据分析,做出数据分布散点图;
2)定义清洗规则,包括缺失数据处理规则和噪声数据处理规则;
3)执行清洗过程;
4)干净数据回流;
所述的步骤3)中计算在该时间段内各个展示位置点击量的期望值具体为:以下三种方法得到期望值的组合 ,其中,且:
方法一,算术移动平均:,At,i表示在距离当前时间节点第t天,即时间距离t,其中1≤t≤n,i展示位的日点击量;F0,i(1)表示当前时间i展示位的日点击量估计值,0表示当前时间;n表示特定时间段的时长,用天数表示;
方法二,加权移动平均模型:,Ct表示距离当前时间节点第t天的点击量的权重;At,i表示At,i表示在距离当前时间节点第t天,i展示位的日点击量;F0,i(2)表示当前时间i展示位的日点击量估计值;
方法三,移动加权-指数平滑模型:基于移动加权平均计算的结果,结合指数平滑方法,计算公式为 ,表示滑动系数,且0≤≤1,表示在1≤t≤n时间段内,i展示位所有日点击量的期望值,采用方法二的计算公式;F1,i(3)表示距离当前时间前一天的平滑模型计算结果,初始值设置为距离当前时间前一天的实际点击量A1,i。
2.如权利要求1所述的一种对网页信息展示位置进行排序的方法,其特征在于所述的步骤1)中特定时间段包括:5年到1个月区间内的任意时长,以天数为单位。
3.如权利要求1所述的一种对网页信息展示位置进行排序的方法,其特征在于所述的步骤4)中排序按照展示位置价值由高到低,即不同展示位置点击量期望值由高到低排序。
4.如权利要求1所述的一种对网页信息展示位置进行排序的方法,其特征在于所述的步骤5)中所述的排序周期是从1天到3个月时间内的任意时长。
5.如权利要求1所述的一种对网页信息展示位置进行排序的方法,其特征在于所述的缺失数据处理规则采用缺失位置相邻两个数据进行求和平均的方法得到数值,四舍五入求整后填补进入缺失位置。
6.如权利要求1所述的一种对网页信息展示位置进行排序的方法,其特征在于所述的噪声数据处理规则采用异频分箱删除方法:把经过补缺处理的数据由小到大排序,分为3个箱子,第1个箱子占数据量的2.5%,第2个箱子占数据量的95%,第3个箱子占数据量的2.5%;删除第1个箱子和第3个箱子的数据,得到第2个箱子里面的数据,即干净数据,如果2.5%的数据量小于1,则第1和3个箱子里面分别放入最小的和最大的点击量数据。
7.如权利要求1所述的一种对网页信息展示位置进行排序的方法,其特征在于所述的加权移动平均模型中权重Ct随距离当前时间由远到近逐渐增加,越靠近当前时间,权重越大;对同一个t,不同展位的权重Ct是相同的,
权重计算公式:。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710090028.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:充电桩定位方法及系统
- 下一篇:一种有向网络快速查询算法
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置