[发明专利]目标用户群体的确定方法及装置有效
申请号: | 201711279551.6 | 申请日: | 2017-12-06 |
公开(公告)号: | CN108153824B | 公开(公告)日: | 2020-04-24 |
发明(设计)人: | 汪昊宇;彭际群 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈霁 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 用户 群体 确定 方法 装置 | ||
本说明书实施例提供一种目标用户群体的确定方法及装置,包括:按照不同的文本信息,将全体用户群体划分为两个以上的子用户群体。根据各个子用户群体对应的文本信息的筛选条件,从各个子用户群体中筛选出对应的候选用户群体。将各个候选用户群体对应的文本信息与关键词库中的关键词进行精确匹配,匹配成功时,确定文本信息的匹配分数。合并各个候选用户群体,得到核心用户群体。根据核心用户群体中用户的各类文本信息的匹配分数,从核心用户群体中选取种子用户。分别计算种子用户的每类文本信息与其它用户的该类文本信息的相似度。根据该相似度,从其它用户中选取扩展用户。将扩展用户扩充到核心用户群体,从而得到目标用户群体。
技术领域
本说明书一个或多个实施例涉及计算机技术领域,尤其涉及一种目标用户群体的确定方法及装置。
背景技术
传统技术中,在从海量用户中选取目标用户群体时,通常是先对该海量用户主动提供的信息进行人工审核,之后根据经人工审核后确定的目标信息,来进行上述选取操作。或者,预先创建目标名单或者词库,该目标名单或者词库中包含目标信息,之后通过将海量用户各自的文本信息与目标名单或者词库进行匹配,来进行上述选取操作。
因此,需要提供一种更快速、更有效地确定目标用户群体的方案。
发明内容
本说明书一个或多个实施例描述了一种目标用户群体的确定方法及装置,可以更快速、更有效地确定目标用户群体。
第一方面,提供了一种目标用户群体的确定方法,包括:
获取全体用户群体;
将所述全体用户群体划分为两个以上的子用户群体,其中,不同的子用户群体分别对应不同的文本信息;
根据各个子用户群体对应的文本信息的筛选条件,从所述各个子用户群体中筛选出对应的候选用户群体,得到两个以上的候选用户群体;
对每个候选用户群体,将对应的文本信息与关键词库中的关键词进行精确匹配,若匹配成功,则确定所述文本信息的匹配分数;
合并所述两个以上的候选用户群体,得到核心用户群体;
根据所述核心用户群体中用户的各类文本信息的匹配分数,从所述核心用户群体中选取种子用户;
分别计算所述种子用户的每类文本信息与所述全体用户群体中除所述种子用户外的其它用户的该类文本信息的相似度;
根据所述相似度,从所述其它用户中选取扩展用户;
将所述扩展用户扩充到所述核心用户群体,从而得到目标用户群体。
第二方面,提供了一种目标用户群体的确定装置,包括:
获取单元,用于获取全体用户群体;
划分单元,用于将所述获取单元获取的所述全体用户群体划分为两个以上的子用户群体,其中,不同的子用户群体分别对应不同的文本信息;
筛选单元,用于根据所述划分单元划分的各个子用户群体对应的文本信息的筛选条件,从所述各个子用户群体中筛选出对应的候选用户群体,得到两个以上的候选用户群体;
匹配单元,用于对所述筛选单元筛选的每个候选用户群体,将对应的文本信息与关键词库中的关键词进行精确匹配,若匹配成功,则确定所述文本信息的匹配分数;
合并单元,用于合并所述筛选单元筛选的所述两个以上的候选用户群体,得到核心用户群体;
选取单元,用于根据所述核心用户群体中用户的各类文本信息的匹配分数,从所述核心用户群体中选取种子用户;
计算单元,用于分别计算所述选取单元选取的所述种子用户的每类文本信息与所述全体用户群体中除所述种子用户外的其它用户的该类文本信息的相似度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711279551.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种友情链接批量上传方法
- 下一篇:数据访问方法及装置