[发明专利]一种电子商务用户公共访问轨迹提取方法和装置无效
申请号: | 201010618096.X | 申请日: | 2010-12-31 |
公开(公告)号: | CN102542478A | 公开(公告)日: | 2012-07-04 |
发明(设计)人: | 贾哲;田斌;李栋 | 申请(专利权)人: | 北京安码科技有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100082 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 电子商务 用户 公共 访问 轨迹 提取 方法 装置 | ||
技术领域
本发明涉及计算机数据挖掘技术,特别涉及一种电子商务用户公共访问轨迹的提取方法和装置。
背景技术
在现代化信息高速通道上,随着电子商务的发展不断完善以及国内互联网用户不断增多,客户通过电子平台进行业务自助办理的数量逐年上升。电子商务平台的建设好坏直接影响了客户对企业品牌的认知度和信任度。但随着电子商务平台应用和规模的不断扩大,很多业务办理流程呈现出繁琐冗余、页面之间关联混乱的状态,极大的降低了客户体验的满意度。
随着国内外电子商务企业对于提升客户体验的需求增加,通过研究客户体验来维系客户和提高忠诚度,国内外对于用户体验分析的相关产品逐步出现,主要包括Oracle的RUEI产品。
RUEI全称是Real User Experience Insight,即真实客户体验洞察力产品。RUEI产品以实际内容和总体响应时间的形式,对实际返回的结果进行监控并提交深入的分析报告。分析结果从不同层面展现给公司不同的用户,提供分析帮助。但是RUEI产品提供的更多是基础层级的数据报表分析,在用户数据挖掘分析上所做的工作十分有限。
现有的数据挖掘相关技术主要是基于传统理论上的学院派数据挖掘算法,在电子商务数据分析中起到了重要的作用,但是也存在算法实用性欠缺,运算量及运算速度无法满足实际数据要求等诸多缺点。另外,现有的数据挖掘相关技术与数据采集是相互独立的过程,不能对实时采集的数据进行挖掘。较为典型的序列模式挖掘算法包括GSP和SPADE,都直接或间接的运用了Apriori算法的性质,采用多次扫描的候选产生—测试方法,以宽度优先的方式产生很大的候选集,特别是在挖掘长序列的时候,更需要更加有效的挖掘方法。
综上所述,现有用户体验分析相关产品或缺少用户数据挖掘功能,或不能挖掘实时数据,且挖掘效率低,无法满足大规模数据挖掘的性能。
发明内容
本发明实施例提供的一种电子商务用户公共访问轨迹提取方法和装置,用以解决从海量数据中提取有效信息,分析用户公共访问轨迹,有效改善电子商务用户体验。
一种电子商务用户公共访问轨迹提取方法包括:
通过DPI数据采集器旁路部署在电子商务网站出口点的路由器上,镜像采集电子商务网站的服务器流量,将采集的流量数据进行解析并存入数据库中;
对DPI采集的基础数据进行预处理;
通过PrefixSpan算法快速挖掘用户访问序列,提取满足设定支持度阈值的序列模式,即为用户公共访问轨迹。
一种电子商务用户公共访问轨迹提取装置包括:
数据采集模块:用于电子商务用户公共轨迹提取的所有基础数据的采集和解析,存入数据库中;
基础数据预处理模块:用于将基础数据进行格式化预处理,每天自动定时进行处理,生成待挖掘的数据集;
公共用户轨迹挖掘模块:用于将预处理后的数据进行用户公共访问轨迹的挖掘,并进行挖掘结果的展示。
本发明实施例在实时采集的流量数据中挖掘用户的公共访问轨迹,旁路部署,无需更改电子商务网站现有网络架构;镜像采集所有电子商务网站的用户访问流量,涵盖流量范围全;采用PrefixSpan算法,避免产生候选集,使得用户公共访问轨迹的提取和挖掘更加快速,并减少提取用户公共访问轨迹所占的存储空间,系统资源占用小。
附图说明
图1为实施例提取用户公共访问轨迹的部署架构图;
图2为本发明DPI数据采集系统平台架构图;
图3为本发明数据预处理流程图;
图4为本发明提取用户公共轨迹的流程图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京安码科技有限公司,未经北京安码科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010618096.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种泛在传感网络控制器的发现方法
- 下一篇:太阳能电池模组免焊粘接技术