[发明专利]用户操作行为分析方法、电子装置及计算机可读存储介质有效
申请号: | 201811023319.0 | 申请日: | 2018-09-03 |
公开(公告)号: | CN109284372B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 何博;古立夫;吕琦 | 申请(专利权)人: | 平安证券股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
地址: | 518000 广东省深圳市福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 操作 行为 分析 方法 电子 装置 计算机 可读 存储 介质 | ||
本发明提供一种用户操作行为分析方法,该方法分析第一时间内的用户日志数据,将得到的有效操作行为序列作为训练样本句子,将所述训练样本句子转换为向量,降维后得到第一向量形成的样本空间,对所述第一向量进行聚类,得到该第一时间内用户操作日志数据的分类类别及主题标签。之后,该方法分析第二时间内的用户日志数据得到第二时间内的用户操作行为序列,将用户操作行为序列转换为向量后映射到所述样本空间,得到该第二时间对应的第二向量,计算该第二向量与所述第一向量之间的欧氏距离,根据最小距离值确定该第二向量所属的分类类别并标注主题标签。本发明还提供一种电子装置及计算机可读存储介质。
技术领域
本发明涉及计算机学习算法领域,尤其涉及一种用户操作行为分析方法、电子装置及计算机可读存储介质。
背景技术
用户的操作行为,即用户对应用系统或应用软件的操作行为,本质上是用户为了达到某种目标,通过机器能够理解的语言指导机器去实现目的,是一种人机对话的方式。随着互联网金融的发展,越来越多的用户通过电脑、智能手机操作金融业务,如何对海量的用户操作行为进行有效分析以识别出欺诈行为,是当前互联网金融公司面临的一大挑战。现有技术中,有很多利用有监督学习算法,例如基于神经网络、贝叶斯分类、逻辑回归的评分卡模型、支持向量机模型等,通过建立正、负样本,利用正、负样本对模型进行训练,再应用训练后的模型对用户实时操作行为进行识别的方法。
这些有监督的学习算法,是由行业专家对已知数据进行提炼分成正常操作/正常用户(正例)和异常操作/欺诈用户(负例)样本,利用机器去学习正负样本特征,最后对每个用户做出概率上的打分。数据提炼过程本质是通过统计知识对数据信息量进行压缩,难以避免信息丢失。此外,实际情况中欺诈用户量相对正常用户是非常微小的,非均衡数据对有监督算法有效性的影响非常严重,而欺诈方式千变万化,传统的机器学习算法想要在正负样例如此悬殊的情况下学习到具有泛化能力的模型是非常困难的。并且,由于正负样本在统计上不可避免的“幸存者偏差”,传统模型的实际有效性大打折扣。最后,模型结构往往是一个概率值,不容易解释,一般还需要加上规则系统共同判定。因为以上原因,现在的反欺诈模型大多数都建立在理论上,实际运用效果较差。
发明内容
有鉴于此,本发明提出一种用户操作行为分析方法、电子装置及计算机可读存储介质,以解决至少一个上述技术问题。
首先,为实现上述目的,本发明提出一种用户操作行为分析方法,该方法包括步骤:
读取第一时间内的用户日志数据,并对用户日志数据进行清洗;
解析清洗后的用户日志数据得到每个用户的一个或多个操作行为序列,过滤掉无效的操作行为序列,得到的有效操作行为序列为训练样本句子;
将所述训练样本句子转换为词袋向量,利用词频模型将所述训练样本句子的词袋向量转换为词频向量,对该词频向量进行降维得到第一向量形成的样本空间;
对所述第一向量进行聚类,得到该第一时间内用户操作日志数据的分类类别及各类别对应的主题标签;
读取第二时间内的用户日志数据,对数据进行清洗、解析得到该第二时间内的用户操作行为序列,将该第二时间内的用户操作行为序列转换为词频向量后利用矩阵变换映射到样本空间,得到该第二时间对应的第二向量;
计算该第二时间内对应的第二向量与所述每个分类类别中的第一向量之间的欧氏距离,根据最小距离值确定该第二时间内对应的第二向量所属的分类类别并标注相应的主题标签。
优选地,将所述训练样本句子转换为词袋向量,利用词频模型将所述训练样本句子的词袋向量转换为词频向量,对该词频向量进行降维得到第一向量形成的样本空间的步骤包括:
通过词袋模型得到每个训练样本句子中代表用户操作行为的各操作代码的出现次数;
利用词频-逆词频算法计算得到每个训练样本句子中各操作代码的出现次数对应的词频;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安证券股份有限公司,未经平安证券股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811023319.0/2.html,转载请声明来源钻瓜专利网。