[发明专利]跨APP的用户行为分析模型训练方法、分析方法及相关设备在审
申请号: | 202010798039.8 | 申请日: | 2020-08-10 |
公开(公告)号: | CN111949867A | 公开(公告)日: | 2020-11-17 |
发明(设计)人: | 杜宇衡;萧梓健 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/2458;G06F40/216;G06N20/00;G06Q30/06 |
代理公司: | 深圳市赛恩倍吉知识产权代理有限公司 44334 | 代理人: | 何春兰;迟珊珊 |
地址: | 518000 广东省深圳市福田区益田路503*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | app 用户 行为 分析 模型 训练 方法 相关 设备 | ||
本发明涉及人工智能,提供一种跨APP的用户行为分析模型训练方法、用户行为分析方法、计算机设备及存储介质,包括:获取多个用户在多个APP中的多个埋点数据,并对每个用户对应的多个埋点数据进行排序得到第一埋点数据序列;将每个用户的第一埋点数据序列编码为第一JSON串;将每个第一JSON串切分为多个文本片段;计算每个文本片段的TF‑IDF值,并根据所述TF‑IDF值构建用户行为向量;基于所述多个用户的用户行为向量训练lightGBM网络得到跨APP的用户行为分析模型。本申请首次实现了跨APP的埋点数据的整合,将跨APP的埋点数据序列编码为JSON串,不仅提高了模型训练的效率,且提高了模型分析的性能。此外,本申请还涉及区块链技术,跨APP的用户行为分析模型可存储于区块链。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于跨APP的用户行为分析模型训练方法、跨APP的用户行为分析方法、计算机设备及存储介质。
背景技术
在常见的大数据挖掘应用中,用户在APP上的点击行为已经成为了用户画像、消费预测、商品推荐的重要信息来源。而埋点是APP上页面或按钮的统计工具,每当用户点击某按钮或停留在某页面,埋点被触发,APP会自动上传用户在该APP的点击或浏览信息。通过对用户的埋点序列进行加工,能够分析用户的行为习惯,进而基于用户的行为习惯实现各种商业应用。
发明人在实现本发明的过程中发现,当前埋点序列的加工方式仅仅考虑了一个APP,而对跨APP的埋点序列的加工少有探索。一个APP内的埋点序列数据量较少,并不足以准确的分析出用户的行为习惯。
因此,有必要提供一种跨APP的埋点序列处理方法。
发明内容
鉴于以上内容,有必要提供一种跨APP的用户行为分析模型训练方、跨APP的用户行为分析方法、计算机设备及存储介质,首次实现了跨APP的埋点数据的整合,将跨APP的埋点数据序列编码为JSON串,不仅提高了模型训练的效率,且提高了模型分析的性能。
本发明的第一方面提供一种跨APP的用户行为分析模型训练方法,所述方法包括:
获取多个用户在多个APP中的多个埋点数据,并对每个用户对应的多个埋点数据进行排序得到第一埋点数据序列;
将每个用户的第一埋点数据序列编码为第一JSON串;
将每个第一JSON串切分为多个文本片段;
计算每个文本片段的TF-IDF值,并根据所述TF-IDF值构建用户行为向量;
基于所述多个用户的用户行为向量训练lightGBM网络得到跨APP的用户行为分析模型。
根据本发明的一个可选的实施例,所述将每个用户的第一埋点数据序列编码为第一JSON串包括:
获取所述第一埋点数据序列中的多个埋点数据,其中,所述埋点数据包括:用户标识,埋点时间戳,前缀及埋点内容;
将每个用户的每个埋点时间戳及对应的前缀和埋点内容编码为子JSON串;
将每个用户的用户标识及对应的多个子JSON串编码为嵌套的第一JSON串。
根据本发明的一个可选的实施例,所述将每个第一JSON串切分为多个文本片段包括:
解析所述第一JSON串得到多个埋点内容;
采用预设滑动窗口从所述多个埋点内容中的第一个埋点内容开始滑动,直至滑动到所述多个埋点内容中的最后一个埋点内容;
将每一个滑动窗口对应的埋点内容作为一个文本片段。
根据本发明的一个可选的实施例,所述计算每个文本片段的TF-IDF值包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010798039.8/2.html,转载请声明来源钻瓜专利网。