[发明专利]APP埋点行为分类方法、装置、计算机设备及存储介质有效
申请号: | 202011462475.4 | 申请日: | 2020-12-14 |
公开(公告)号: | CN112231196B | 公开(公告)日: | 2021-03-16 |
发明(设计)人: | 张莉;乔延柯;吴志成;汪珂;张洁妤;张帆;张锐淇 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F11/34 | 分类号: | G06F11/34;G06K9/62 |
代理公司: | 深圳市赛恩倍吉知识产权代理有限公司 44334 | 代理人: | 杨毅玲;刘丽华 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | app 行为 分类 方法 装置 计算机 设备 存储 介质 | ||
本发明涉及人工智能技术领域,提供一种APP埋点行为分类方法、装置、计算机设备及存储介质,包括:确定多个用户的第一埋点数据序列中的每个第一埋点行为对应的第一埋点字符串;根据多个第一埋点字符串生成蒙版图片,并根据每个第一埋点字符串和蒙版图片生成第一埋点字符串图片;对每个第一埋点字符串图片进行切分得到多个第一埋点字符串子图片;计算每个第一埋点字符串子图片的第一信息熵并根据第一信息熵计算任意两个第一埋点字符串图片之间的第一相似度;根据多个第一相似度对多个第一埋点行为进行分类,得到多个埋点行为类别。本发明无需准备埋点解析表,通过对所有的埋点字符串进行分类实现埋点行为的自动化分类,埋点行为的分类效率较高。
技术领域
本发明涉及人工智能技术领域,具体涉及一种APP埋点行为分类方法、装置、计算机设备及存储介质。
背景技术
APP端会有很多操作行为,对APP的操作行为能够用于预测用户的其他行为。常规的做法是通过设置埋点获取用户一段时间内的操作行为,并对操作行为进行语义解析,从而提取行为特征并训练模型,通过模型预测用户的其他行为。
发明人在实现本发明的过程中发现,现有技术中对操作行为的语义解析需要有埋点解析表,对于埋点解析表中不存在的操作行为,则无法进行语义解析,导致无法提取行为特征;其次,APP页面变更快,使用提取出的行为特征训练得到的模型的泛化能力较差,无法跟上APP的变更速度,导致后续的行为预测精确度较差。
发明内容
鉴于以上内容,有必要提出一种APP埋点行为分类方法、装置、计算机设备及存储介质,无需准备埋点解析表,通过对所有的埋点字符串进行分类实现埋点行为的自动化分类,埋点行为的分类效率较高。
本发明的第一方面提供一种APP埋点行为分类方法,所述方法包括:
采集多个用户的第一埋点数据序列,并确定所述第一埋点数据序列中的每个第一埋点行为对应的第一埋点字符串;
根据多个所述第一埋点字符串生成蒙版图片,并根据每个所述第一埋点字符串和所述蒙版图片生成第一埋点字符串图片;
对每个所述第一埋点字符串图片进行切分,得到多个第一埋点字符串子图片;
计算每个第一埋点字符串子图片的第一信息熵,并根据所述第一信息熵计算任意两个第一埋点字符串图片之间的第一相似度;
根据多个所述第一相似度对多个所述第一埋点行为进行分类,得到多个埋点行为类别。
在一个可选的实施例中,所述根据多个所述第一埋点字符串生成蒙版图片,并根据每个所述第一埋点字符串和所述蒙版图片生成第一埋点字符串图片包括:
计算每个所述埋点字符串的字符串长度;
根据多个所述字符串长度的最大值生成蒙版图片;
定位所述蒙版图片中的目标点;
以所述目标点为起始点将所述第一埋点字符串添加至所述蒙版图片中,得到第一埋点字符串图片。
在一个可选的实施例中,所述对每个所述第一埋点字符串图片进行切分,得到多个第一埋点字符串子图片包括:
计算多个所述字符串长度的最大值与多个所述字符串长度的最小值之间的字符串长度差值;
判断所述字符串长度差值是否大于预设长度阈值;
当所述字符串长度差值大于或者等于所述预设长度阈值时,获取预设第一切分数,并根据所述预设第一切分数对每个所述第一埋点字符串图片进行均匀切分,得到多个第一埋点字符串子图片;
当所述字符串长度差值小于所述预设长度阈值时,获取预设第二切分数,并根据所述预设第二切分数对每个所述第一埋点字符串图片进行均匀切分,得到多个第一埋点字符串子图片。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011462475.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种云服务性能的测试方法
- 下一篇:文本推荐方法、装置、计算机设备及存储介质