[发明专利]基于人工智能的焦点用户挖掘方法和装置有效
申请号: | 202010555168.4 | 申请日: | 2020-06-17 |
公开(公告)号: | CN111460323B | 公开(公告)日: | 2020-09-25 |
发明(设计)人: | 刘志煌 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06F16/2458;G06K9/62;G06N3/04;G06N3/08;G06Q50/00 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 崔晓岚;张颖玲 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人工智能 焦点 用户 挖掘 方法 装置 | ||
1.一种基于人工智能的焦点用户挖掘方法,其特征在于,所述方法包括:
针对焦点用户集合中的每个样本焦点用户,将所述样本焦点用户的特征按照所涉及的类型进行编码处理,以获得所述样本焦点用户的特征编码序列;
针对每个所述样本焦点用户的特征编码序列所包括的多个特征编码子序列,确定出现频率超过频率阈值的特征编码子序列以作为频繁特征编码序列;
对所述频繁特征编码序列中的特征编码进行衍生处理,以将获得的特征编码作为表征所述焦点用户集合的共性的强相关特征编码;
确定多个非强相关特征编码,其中,所述非强相关特征编码是出现频率不超过所述频率阈值的特征编码子序列中所包含的特征编码;
在多个所述非强相关特征编码中,根据所述非强相关特征编码之间的相关度,选取部分所述非强相关特征编码以作为预备强相关特征编码;
基于所述焦点用户集合中每个样本焦点用户的所述强相关特征编码和所述预备强相关特征编码训练分类模型,并基于所述分类模型获得表征待识别用户是否是焦点用户的分类结果。
2.根据权利要求1所述的方法,其特征在于,所述将所述样本焦点用户的特征按照所涉及的类型进行编码处理,以获得所述样本焦点用户的特征编码序列,包括:
在所述样本焦点用户的用户数据中,提取基础属性类型和行为属性类型的数据,并基于所提取的数据构建多个用户特征;
根据每个所述用户特征的特征值,从相应类型的编码表查找所述特征值的编码值;
将对应每个所述用户特征的特征值所查找到的编码值进行组合,以获得所述样本焦点用户的特征编码序列。
3.根据权利要求2所述的方法,其特征在于,在所述根据每个所述用户特征的特征值,从相应类型的编码表查找所述特征值的编码值之前,所述方法还包括:
对所述多个用户特征中的每个用户特征、以及相应的特征值进行以下预处理操作:
确定所述每个用户特征的特征值的缺失数量、以及针对同一用户特征的相同特征值的数量;
将特征值的缺失数量超过缺失值过滤阈值、以及相同特征值的数量超过相同数量阈值的用户特征进行过滤,以获得过滤后的特征;
舍弃对应于所述过滤后的特征的异常特征值,并针对所述过滤后的特征中缺失的特征值进行特征值填充;
构造所述过滤后的特征、以及特征值填充后的特征值,以获得用于进行编码处理的用户特征。
4.根据权利要求1所述的方法,其特征在于,所述针对每个所述样本焦点用户的特征编码序列所包括的多个特征编码子序列,确定出现频率超过频率阈值的特征编码子序列以作为频繁特征编码序列,包括:
在不同样本焦点用户的多个特征编码序列中,多次选取特征编码,并将每次选取的多个特征编码进行组合,以获得多个不同的特征编码子序列;
其中,每次选取的多个特征编码中均包含归属于不同样本焦点用户的特征编码序列中的特征编码;
在所述多个不同的特征编码子序列形成的序列集合中,选取出现频率超过所述频率阈值的特征编码子序列,以作为频繁特征编码序列。
5.根据权利要求1所述的方法,其特征在于,所述对所述频繁特征编码序列中的特征编码进行衍生处理,包括:
从所述频繁特征编码序列中提取多个特征编码;
将提取的多个特征编码进行以下至少之一的处理:
将所述多个特征编码中的单一变量进行基础转换;
将所述多个特征编码中的多变量进行组合;
在所述多个特征编码中添加时间维度以进行衍生;
根据决策树的路径,将所述多个特征编码进行组合。
6.根据权利要求1所述的方法,其特征在于,
所述分类模型包括多个基分类模型;
所述基于所述焦点用户集合中每个样本焦点用户的所述强相关特征编码和所述预备强相关特征编码训练分类模型,包括:
将所述焦点用户集合中每个样本焦点用户的所述强相关特征编码、所述预备强相关特征编码和焦点用户标签构成训练样本;
基于构造的多个训练样本,训练所述多个基分类模型;
将训练完成的多个基分类模型通过集合策略进行整合,以获得所述分类模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010555168.4/1.html,转载请声明来源钻瓜专利网。