[发明专利]用户行为数据处理方法、装置及计算机可读存储介质有效
申请号: | 201710636447.1 | 申请日: | 2017-07-28 |
公开(公告)号: | CN107577706B | 公开(公告)日: | 2019-09-20 |
发明(设计)人: | 邵雷锋;谷峰;王红艳;杨东 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/903 | 分类号: | G06F16/903;G06F21/30 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 胡海国 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 行为 数据处理 方法 装置 计算机 可读 存储 介质 | ||
本发明公开了一种用户行为数据处理方法,包括以下步骤:定时获取预设服务器中存储的日志信息;确定所述日志信息的各个行数据中是否存在满足预设格式的行数据,其中,所述行数据为所述日志信息中的各行对应的数据;将满足预设格式的所述行数据设置为用户行为信息;按照预设规则对所述用户行为信息进行数据统计,以获得所述用户行为信息的统计信息。本发明还公开了一种用户行为数据处理装置及计算机可读存储介质。本发明用HADOOP大数据平台定时对日志信息进行获取,避免了HADOOP大数据平台实时对数据进行处理,减少了处理次数,进而减小了HADOOP数据大平台的运行压力。
技术领域
本发明涉及数据处理技术领域,尤其涉及一种用户行为数据处理方法、装置及计算机可读存储介质。
背景技术
随着互联网用户人数用户日益增长,用户行为分析已成为互联网领域的重要方法之一,而且操作行为的记录与分析,对产品发展至关重要。
目前,对用户行为进行分析是通过客户端抓取数据,并实时将抓取到的数据上传到WEB服务器,在接收到客户端上传的数据时,WEB服务器将该数据上传至数据库服务器;在接收到WEB服务器上传的数据时,数据库服务器对接收到的数据进行处理,以根据该数据进行用户行为的分析。
但是,由于数据库服务器需要对接收到的数据进行实时处理,造成数据库服务器进行数据处理次数较多,导致数据库服务器处理压力较大,影响数据库服务器的处理效率。
发明内容
本发明的主要目的在于提供用户行为数据处理方法、装置及计算机可读存储介质,旨在解决对用户行为进行分析的过程中数据库服务器处理压力较大而影响数据库服务器处理效率的技术问题。
为实现上述目的,本发明提供一种用户行为数据处理方法,所述技术方法包括以下步骤:
定时获取预设服务器中存储的日志信息,其中,所述日志信息包括客户端抓取并发送至所述预设服务器的用户行为数据;
确定所述日志信息的各个行数据中是否存在满足预设格式的行数据,其中,所述行数据为所述日志信息中的各行对应的数据;
将满足预设格式的所述行数据设置为用户行为信息;
按照预设规则对所述用户行为信息进行数据统计,以获得所述用户行为信息的统计信息。
优选地,所述将满足预设格式的所述行数据设置为用户行为信息的步骤包括:
确定满足预设格式的所述行数据中是否存在满足预设权限的行数据;
在满足预设格式的所述行数据中存在满足预设权限的行数据时,将满足预设权限的所述行数据设置为用户行为信息。
优选地,确定满足预设格式的所述行数据中是否存在满足预设权限的行数据的步骤包括:
在满足预设格式的所述行数据中,获取包括预设字符或预设字符串的行数据;
对包括预设字符或预设字符串的所述行数据中,预设字符或预设字符串后的第一个单词进行权限验证操作,以获得验证通过的行数据,其并将验证通过的行数据设置为满足预设权限的行数据。
优选地,将满足预设格式的所述行数据设置为用户行为信息的步骤包括:
在满足预设格式的行数据中,获取包括预设字符或预设字符串的行数据;
确定包括预设字符或预设字符串的所述行数据中,是否存在预设字符或预设字符串后第二个单词为预设信息的行数据;
将预设字符或预设字符串后第二个单词为预设信息的行数据设置为用户行为信息。
优选地,将满足预设格式的所述行数据设置为用户行为信息的步骤还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710636447.1/2.html,转载请声明来源钻瓜专利网。