[发明专利]兴趣特征确定方法、装置、设备及存储介质在审
申请号: | 202010241418.7 | 申请日: | 2020-03-31 |
公开(公告)号: | CN111461118A | 公开(公告)日: | 2020-07-28 |
发明(设计)人: | 曾瑞;邵波;冀宇 | 申请(专利权)人: | 中国移动通信集团黑龙江有限公司;中国移动通信集团有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62;G06Q50/00 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 彭琼 |
地址: | 150028 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 兴趣 特征 确定 方法 装置 设备 存储 介质 | ||
本发明公开了一种兴趣特征确定方法、装置、设备及存储介质。该方法包括:根据获取的多个用户的用户通信行为信息和用户兴趣特征信息,生成用户关系图;根据获取的多个用户的用户兴趣特征信息,生成用户兴趣特征图;根据用户关系图和用户兴趣特征图,确定第一用户群体和第二用户群体;基于第二用户群体,对第一用户群体进行聚类,确定第三用户群体的兴趣特征;其中,第三用户群体包括第一用户群体和第二用户群体,能够提高识别用户群体的准确性和群体特征丰富性。
技术领域
本发明属于大数据技术领域,尤其涉及一种兴趣特征确定方法、装置、设备及存储介质。
背景技术
随着大数据的快速发展,各大运营商开始从单一的通讯服务提供商逐渐转变为多元化的信息服务提供商。因此,运营商的产业链和价值链也需要更加丰富,那么运营商所拥有的用户成为了运营商的价值链中的核心。而将用户作为运营商的价值链中的核心,需要构建完善的用户标签体系,准确描述用户特征,进而为用户提供差异化的服务信息。
用户标签体系对运营商挖掘用户的意图、活动规律和潜在的兴趣爱好等重要信息具有重要的意义。但是,通过用户标签体系识别用户群体的准确性低且群体特征丰富性差。
发明内容
本发明实施例提供一种兴趣特征确定方法、装置、设备及存储介质,能够解决识别用户群体的准确性低且群体特征丰富性差的问题。
第一方面,提供了一种兴趣特征确定方法,该方法包括:
根据获取的多个用户的用户通信行为信息和用户兴趣特征信息,生成用户关系图;
根据获取的多个用户的用户兴趣特征信息,生成用户兴趣特征图;
根据用户关系图和用户兴趣特征图,确定第一用户群体和第二用户群体;
基于第二用户群体,对第一用户群体进行聚类,确定第三用户群体的兴趣特征;其中,第三用户群体包括第一用户群体和第二用户群体。
在一种可能的实现方式中,根据获取的多个用户的用户兴趣特征信息,生成用户兴趣特征图,包括:
根据多个用户的用户兴趣特征信息,提取每个用户的兴趣特征向量;
根据每个用户的兴趣特征向量,计算用户之间兴趣特征的相似度;
根据用户之间兴趣特征的相似度,生成用户兴趣特征图。
在一种可能的实现方式中,根据用户关系图和用户兴趣特征图,确定第一用户群体和第二用户群体,包括:
根据用户关系图和用户兴趣特征图,生成用户关系兴趣特征向量;
根据用户关系兴趣特征向量,确定用户的中心度;中心度表示用户在社交网络中的重要度;
根据中心度,确定第一用户群体和第二用户群体。
在一种可能的实现方式中,基于第二用户群体,对第一用户群体进行聚类,确定第三用户群体的兴趣特征,包括:
对第一用户群体进行聚类,得到第一用户群体的目标聚类子集;
计算第二用户群体和第一用户群体之间的兴趣主题的相似度;
将第二用户群体和第一用户群体之间的兴趣主题的相似度最高对应的第二用户群体加入到第一用户群体的聚类子集中,得到用户群体聚类子集和用户群体聚类子集的兴趣特征;
根据用户群体聚类子集和用户群体聚类子集的兴趣特征,确定第三用户群体的兴趣特征。
在一种可能的实现方式中,对第一用户群体进行聚类,得到第一用户群体的目标聚类子集,包括:
获取第一用户群体中用户对不同兴趣主题的兴趣特征值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团黑龙江有限公司;中国移动通信集团有限公司,未经中国移动通信集团黑龙江有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010241418.7/2.html,转载请声明来源钻瓜专利网。