[发明专利]一种基于图嵌入的多任务用户交互日志分段方法在审
申请号: | 202211533148.2 | 申请日: | 2022-12-02 |
公开(公告)号: | CN116089608A | 公开(公告)日: | 2023-05-09 |
发明(设计)人: | 俞东进;方鑫杨;孙笑笑;曾莉莉;王思轩 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/18;G06F18/22;G06F18/23213;G06F16/901;G06N3/084 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 310018 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 嵌入 任务 用户 交互 日志 分段 方法 | ||
1.一种基于图嵌入的多任务用户交互日志分段方法,其特征在于,该方法包括以下步骤:
(1)收集多任务场景下用户与应用程序交互产生的用户交互日志
(2)在(1)的基础上进行数据预处理工作,包括去除噪声行为、从行为上下文中提取行为属性上下AC和行为内容上下文CC;
(3)根据行为间的直接跟随关系,将用户交互日志表示为直接跟随图;
(4)在(3)的基础上,利用行为属性上下文和内容上下文对直接跟随图做权重增强操作;
(5)在完成权重增强的直接跟随图上,利用图嵌入算法node2vec学习行为节点的向量表示;
(6)根据行为节点向量计算行为的前驱相似度和后继相似度
(7)在(6)的基础上,根据行为前驱、后继相似度变化情况,确定日志分割点,对用户交互日志进行切分;
(8)给定任务类别数,对步骤(7)得到的日志切片利用K-均值算法进行聚类,将聚类后的结果按照时间戳大小排序得到完整的任务日志,以此实现任务分段的目的。
2.根据权利要求1所述的基于图嵌入的多任务用户交互日志分段方法,其特征在于,所述用户交互日志由行为ai=(t,τ,C)按照时间戳升序排序得到的有序集合,其中t表示时间戳,τ表示行为类型,C表示行为上下文,所述用户交互日志包括软件类型、文件名、表单名、URL、组件标签以及组件内容。
3.根据权利要求1所述的基于图嵌入的多任务用户交互日志分段方法,其特征在于,所述去除噪声行为包括去除冗余行为和去除无关行为。
4.根据权利要求1所述的基于图嵌入的多任务用户交互日志分段方法,其特征在于,所述步骤(2)中,所述行为属性上下文主要用于描述该行为发生的位置信息,所述行为属性上下文包括软件类型、文件名、表单名、URL和组件标签;所述行为内容上下文用于描述该行为发生时应用程序上内容的变化情况。
5.根据权利要求1所述的基于图嵌入的多任务用户交互日志分段方法,其特征在于,所述步骤(3)的实现方法为:以行为类型和行为属性上下文的组合作为节点标识,以行为间的直接跟随关系作为边,以直接跟随关系频次作为权重,构建直接跟随图G=(V,E,W),其中:V={v1,v2,...,vn}表示节点集合,E={e1,e2,...,em}表示边集合,W={w1,w2,…wm}表示权重集合。
6.根据权利要求1或5所述的基于图嵌入的多任务用户交互日志分段方法,其特征在于,所述步骤(4)中,权重增强公式为:
其中:i表示节点vx,vy间第i次出现的直接跟随关系,权重增强因子的定义如下:
其中:表示节点vx对应的行为,表示节点vy对应的行为;simAC(,)和simCC(,)分别表示行为属性上下文和行为内容上下文的莱文斯坦距离相似度。
7.根据权利要求1所述的基于图嵌入的多任务用户交互日志分段方法,其特征在于,所述步骤(5)具体如下子步骤:
(5.1)计算图节点间转移概率,转移概率计算公式如下:
其中,α为控制采样策略的超参数,表示节点vx和vy连边的增强权重;
(5.2)随机选取若干节点作为起点,在图中进行游走采样得到采样路径;
(5.3)以采样路径作为学习样本,利用随机梯度下降算法学习得到节点的向量表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211533148.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:线切割加工工艺
- 下一篇:一种钻锚机器人多钻臂协同控制方法、系统、设备及介质