[发明专利]缓存区数据的预处理方法及系统有效
申请号: | 201510412138.7 | 申请日: | 2015-07-14 |
公开(公告)号: | CN105022699B | 公开(公告)日: | 2018-04-24 |
发明(设计)人: | 施文进;胡芳槐;阎九吉;吴青;王飞 | 申请(专利权)人: | 惠龙易通国际物流股份有限公司;镇江惠龙长江港务有限公司;江苏惠银科技股份有限公司 |
主分类号: | G06F12/0806 | 分类号: | G06F12/0806;G06F12/0879;G06F12/0895 |
代理公司: | 南京苏高专利商标事务所(普通合伙)32204 | 代理人: | 汤磊 |
地址: | 210002 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 缓存 数据 预处理 方法 系统 | ||
技术领域
本发明涉及一种数据的预处理方法及系统,尤其涉及一种应用于缓存区数据的预处理方法及系统。
背景技术
目前数据预处理技术主要是单纯的采用一种技术,而电子商务数据具有突发性强和瞬间数据负责异常繁重等特点,单纯使用一种处理技术会造成很大的数据处理负担,不能满足电子商务的需求。
先入先出队列是一种传统的按序执行方法,当缓存区数据满时,最先进入缓存区的数据/指令先完成执行并离开缓存区,跟着才执行第二条数据/指令。是一种先进先出的数据缓存器,他与普通存储器的区别是没有外部读写地址线,这样使用起来非常简单,但缺点就是只能顺序写入数据,顺序的读出数据,其数据地址由内部读写指针自动加1完成,不能像普通存储器那样可以由地址线决定读取或写入某个指定的地址,其不能精确预估在电子商务数据系统中的用户查询时间、停留时间、查询内容;统计方法,利用数学统计方法,统计数据的系统频率,把活跃用户信息优选存在缓存区,通过颜色寄存器缓存在缓存器内与当前访问的物理地址的内存区域的颜色对应的缓存区中,能够提高缓存的使用效率,提高系统性能,但该方法仍然无法满足电子商务数据的特点。
本发明提供了一种缓存区数据的预处理方法,该方法通过机器学习的方法,研究用户的行为准则,预测用户查询时间,每次工作时间和查询内容等,系统将根据预测信息提前设置缓存区数据,从而使用户的查询体验最优化。
发明内容
本发明实施例提供了一种缓存区数据的预处理方法,该方法通过机器学习的方法,研究用户的行为准则,预测用户查询时间,每次工作时间和查询内容等,系统将根据预测信息提前设置缓存区数据,从而使用户的查询体验最优化。
为达到上述目的,本发明的实施例采用如下技术方案:
本发明第一方面提供一种缓存区数据预处理方法,包括:
记录构造基础数据,对基础数据预处理;
建立最小二乘法模型模拟用户行为,预测用户工作时间和查询内容等参数之间的数据关系;
存储从缓存输入接收的数据到缓存区,按照先进先出顺序从所述缓存区中输出。
优选的,根据第一方面,所述记录构造基础数据,具体包括:
基础数据是指用户查询时间TimeUserQuery、用户停留时间TimeUserStand和用户查询内容ContentUserQuery。构造TimeUserQuery,TimeUserStand和ContentUserQuery接口函数从初始服务器端获取客户端用户的查询时间,停留时间和查询内容;在所述TimeUserQuery和TimeUserStand函数中预设计时器Timer,并采用cookie控件技术,获取当前行为中用户的查询时间和停留时间;将收集到的数据通过GET、POST异步的方式发送到目标服务器端;所述基础数据通过接口以JSON格式展示到所述目标服务器端。
优选的,所述用户查询内容ContentUserQuery,具体包括:
系统预设用户可以操作的所有查询内容有Loading、Unloading、Cargo、Carrier和Route中的一种或其任意组合(不同的行业和需求可预设不同查询内容),ContentUserQuery接口函数的参数为Loading、Unloading、Cargo、Carrier和Route,根据用户的不同操作行为,返回和展示的参数值不同,进行了所述查询内容的参数返回值设为1,没有进行所述查询内容的参数返回值设为0。
优选的,根据第一方面,所述对基础数据预处理,具体包括:
所述目标服务器接收到返回值和返回内容后,系统使用JObject或JArray的Parse方法将JSON字符串转换为JSON对象,通过所述JSON对象的方式提取所述基础数据,分析所述基础数据查询内容和查询时间之间的关联即构造Loading、Unloading、Cargo、Carrier、Route和TimeUserQuery以及TimeUserStand的关系图。
优选的,根据第一方面,所述构造Loading、Unloading、Cargo、Carrier、Route和TimeUserQuery以及TimeUserStand的关系图,一种可能实现方式为:
优选的,所述关系图中,TimeUserQuery和TimeUserStand各自作为因变量和Loading、Unloading、Cargo、Carrier、Route作为自变量,观察图形发现具有一定的线性回归趋势,考虑用最小二乘法做出预测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于惠龙易通国际物流股份有限公司;镇江惠龙长江港务有限公司;江苏惠银科技股份有限公司,未经惠龙易通国际物流股份有限公司;镇江惠龙长江港务有限公司;江苏惠银科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510412138.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种快速可销毁HDD硬盘的设计方法
- 下一篇:一种面向智能元的编程语言系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置