[发明专利]用户操作行为分析方法、电子装置及计算机可读存储介质有效
申请号: | 201811023319.0 | 申请日: | 2018-09-03 |
公开(公告)号: | CN109284372B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 何博;古立夫;吕琦 | 申请(专利权)人: | 平安证券股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
地址: | 518000 广东省深圳市福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种用户操作行为分析方法,该方法分析第一时间内的用户日志数据,将得到的有效操作行为序列作为训练样本句子,将所述训练样本句子转换为向量,降维后得到第一向量形成的样本空间,对所述第一向量进行聚类,得到该第一时间内用户操作日志数据的分类类别及主题标签。之后,该方法分析第二时间内的用户日志数据得到第二时间内的用户操作行为序列,将用户操作行为序列转换为向量后映射到所述样本空间,得到该第二时间对应的第二向量,计算该第二向量与所述第一向量之间的欧氏距离,根据最小距离值确定该第二向量所属的分类类别并标注主题标签。本发明还提供一种电子装置及计算机可读存储介质。 | ||
搜索关键词: | 用户 操作 行为 分析 方法 电子 装置 计算机 可读 存储 介质 | ||
【主权项】:
1.一种用户操作行为分析方法,其特征在于,所述方法包括步骤:读取第一时间内的用户日志数据,并对用户日志数据进行清洗;解析清洗后的用户日志数据得到每个用户的一个或多个操作行为序列,过滤掉无效的操作行为序列,得到的有效操作行为序列为训练样本句子;将所述训练样本句子转换为词袋向量,利用词频模型将所述训练样本句子的词袋向量转换为词频向量,对该词频向量进行降维得到第一向量形成的样本空间;对所述第一向量进行聚类,得到该第一时间内用户操作日志数据的分类类别及各类别对应的主题标签;读取第二时间内的用户日志数据,对数据进行清洗、解析得到该第二时间内的用户操作行为序列,将该第二时间内的用户操作行为序列转换为词频向量后利用矩阵变换映射到样本空间,得到该第二时间对应的第二向量;计算该第二时间内对应的第二向量与所述每个分类类别中的第一向量之间的欧氏距离,根据最小距离值确定该第二时间内对应的第二向量所属的分类类别并标注相应的主题标签。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安证券股份有限公司,未经平安证券股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811023319.0/,转载请声明来源钻瓜专利网。