[发明专利]基于人工智能的焦点用户挖掘方法和装置有效
申请号: | 202010555168.4 | 申请日: | 2020-06-17 |
公开(公告)号: | CN111460323B | 公开(公告)日: | 2020-09-25 |
发明(设计)人: | 刘志煌 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06F16/2458;G06K9/62;G06N3/04;G06N3/08;G06Q50/00 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 崔晓岚;张颖玲 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人工智能 焦点 用户 挖掘 方法 装置 | ||
本发明提供了一种基于人工智能的焦点用户挖掘方法和装置;方法包括:将样本焦点用户的特征按照所涉及的类型进行编码处理,以获得样本焦点用户的特征编码序列;针对每个样本焦点用户的特征编码序列所包括的多个特征编码子序列,确定出现频率超过频率阈值的特征编码子序列以作为频繁特征编码序列;对频繁特征编码序列中的特征编码进行衍生处理,以将获得的特征编码作为表征焦点用户集合的共性的强相关特征编码;基于焦点用户集合中每个样本焦点用户的强相关特征编码训练分类模型,并基于分类模型获得表征待识别用户是否是焦点用户的分类结果。通过本发明,能够高效且准确的挖掘焦点用户。
技术领域
本发明涉及人工智能领域和大数据技术领域,尤其涉及一种基于人工智能的焦点用户挖掘方法、装置、电子设备及计算机可读存储介质。
背景技术
人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法和技术及应用系统。人工智能现如今得到快速发展,并广泛应用于各种行业。
以焦点用户挖掘的应用场景为例,焦点用户是指拥有更多且更准确的产品信息,且为相关群体所接受或信任,并对该群体的购买行为有较大影响力的人。随着大数据的发展,焦点用户的识别和挖掘对行业领域内相关应用具有非常重要的意义,通过挖掘行业或产品高潜和传播力较强的焦点用户,能够指导产品和相关业务的运营和投放,且更有针对性的对目标用户群体进行推送,达到事半功倍的效果。因此,如何高效且准确地挖掘焦点用户群体,对行业发展、产品运营、业务引流等都起着至关重要的作用。
然而,相关技术对于如何高效且准确的挖掘焦点用户尚无有效的方案。
发明内容
本发明实施例提供一种基于人工智能的焦点用户挖掘方法、装置、电子设备及计算机可读存储介质,能够高效且准确的挖掘焦点用户。
本发明实施例的技术方案是这样实现的:
本发明实施例提供一种基于人工智能的焦点用户挖掘方法,所述方法包括:
针对焦点用户集合中的每个样本焦点用户,将所述样本焦点用户的特征按照所涉及的类型进行编码处理,以获得所述样本焦点用户的特征编码序列;
针对每个所述样本焦点用户的特征编码序列所包括的多个特征编码子序列,确定出现频率超过频率阈值的特征编码子序列以作为频繁特征编码序列;
对所述频繁特征编码序列中的特征编码进行衍生处理,以将获得的特征编码作为表征所述焦点用户集合的共性的强相关特征编码;
基于所述焦点用户集合中每个样本焦点用户的强相关特征编码训练分类模型,并基于所述分类模型获得表征待识别用户是否是焦点用户的分类结果。
本发明实施例提供一种基于人工智能的焦点用户挖掘装置,包括:
编码模块,用于针对焦点用户集合中的每个样本焦点用户,将所述样本焦点用户的特征按照所涉及的类型进行编码处理,以获得所述样本焦点用户的特征编码序列;
选取模块,用于针对每个所述样本焦点用户的特征编码序列所包括的多个特征编码子序列,确定出现频率超过频率阈值的特征编码子序列以作为频繁特征编码序列;
衍生模块,用于对所述频繁特征编码序列中的特征编码进行衍生处理,以将获得的特征编码作为表征所述焦点用户集合的共性的强相关特征编码;
识别模块,用于基于所述焦点用户集合中每个样本焦点用户的强相关特征编码训练分类模型,并基于所述分类模型获得表征待识别用户是否是焦点用户的分类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010555168.4/2.html,转载请声明来源钻瓜专利网。