[发明专利]用户行为数据处理方法、装置及计算机可读存储介质有效
申请号: | 201710636447.1 | 申请日: | 2017-07-28 |
公开(公告)号: | CN107577706B | 公开(公告)日: | 2019-09-20 |
发明(设计)人: | 邵雷锋;谷峰;王红艳;杨东 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/903 | 分类号: | G06F16/903;G06F21/30 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 胡海国 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种用户行为数据处理方法,包括以下步骤:定时获取预设服务器中存储的日志信息;确定所述日志信息的各个行数据中是否存在满足预设格式的行数据,其中,所述行数据为所述日志信息中的各行对应的数据;将满足预设格式的所述行数据设置为用户行为信息;按照预设规则对所述用户行为信息进行数据统计,以获得所述用户行为信息的统计信息。本发明还公开了一种用户行为数据处理装置及计算机可读存储介质。本发明用HADOOP大数据平台定时对日志信息进行获取,避免了HADOOP大数据平台实时对数据进行处理,减少了处理次数,进而减小了HADOOP数据大平台的运行压力。 | ||
搜索关键词: | 用户 行为 数据处理 方法 装置 计算机 可读 存储 介质 | ||
【主权项】:
1.一种用户行为数据处理方法,其特征在于,所述用户行为数据处理方法包括以下步骤:定时获取预设服务器中存储的日志信息,其中,所述日志信息包括客户端抓取并发送至所述预设服务器的用户行为数据;确定所述日志信息的各个行数据中是否存在满足预设格式的行数据,其中,所述行数据为所述日志信息中的各行对应的数据;将满足预设格式的所述行数据设置为用户行为信息;按照预设规则对所述用户行为信息进行数据统计,以获得所述用户行为信息的统计信息;其中,所述将满足预设格式的所述行数据设置为用户行为信息的步骤包括:在所述日志信息的各个行数据中存在满足预设格式的行数据时,确定满足预设格式的所述行数据中是否存在满足预设权限的行数据;在满足预设格式的所述行数据中存在满足预设权限的行数据时,在满足预设权限的所述行数据中,获取包括预设字符或预设字符串的行数据;确定包括预设字符或预设字符串的所述行数据中,是否存在预设字符或预设字符串后第二个单词为预设信息的行数据;当存在预设字符或预设字符串后第二个单词为预设信息的行数据时,在预设字符或预设字符串后第二个单词为预设信息的行数据中,获取包括预设字符或预设字符串的行数据;确定包括预设字符或预设字符串的所述行数据中,是否存在预设字符或预设字符串后单词的个数小于预设阈值的行数据;当存在预设字符或预设字符串后单词的个数小于预设阈值的行数据时,将预设字符或预设字符串后单词的个数小于预设阈值的行数据设置为用户行为信息。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710636447.1/,转载请声明来源钻瓜专利网。