[发明专利]目标用户群体的确定方法及装置有效
申请号: | 201711279551.6 | 申请日: | 2017-12-06 |
公开(公告)号: | CN108153824B | 公开(公告)日: | 2020-04-24 |
发明(设计)人: | 汪昊宇;彭际群 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈霁 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 用户 群体 确定 方法 装置 | ||
1.一种目标用户群体的确定方法,其特征在于,包括:
获取全体用户群体;
将所述全体用户群体划分为两个以上的子用户群体,其中,每个子用户群体对应于一个类别的文本信息;所述文本信息用于对对应子用户群体中的用户进行刻画,且对应于不同子用户群体的各类文本信息之间相互独立且形式不同;
根据各个子用户群体对应类别的文本信息的筛选条件,从所述各个子用户群体中筛选出对应的候选用户群体,得到两个以上的候选用户群体;
对每个候选用户群体,将对应类别的文本信息与关键词库中的关键词进行精确匹配,若匹配成功,则确定所述类别文本信息的匹配分数;
合并所述两个以上的候选用户群体,得到核心用户群体;
根据所述核心用户群体中用户的各类文本信息的匹配分数,确定该核心用户群体中各用户的匹配等级;所述匹配分数用于表征对应文本信息的重要度;
基于该核心用户群体中各用户的匹配等级,从所述核心用户群体中选取种子用户;
分别计算所述种子用户的每类文本信息与所述全体用户群体中除所述种子用户外的其它用户的该类文本信息的相似度;
根据所述相似度,从所述其它用户中选取扩展用户;
将所述扩展用户扩充到所述核心用户群体,从而得到目标用户群体。
2.根据权利要求1所述的方法,其特征在于,所述文本信息包括:收货地址、通讯录、无线网络名称、全球定位系统GPS定位点对应的公司类地名、互联网协议IP地址所对应的公司名称、多媒体访问控制Mac地址所对应的公司名称、社交软件的备注名称、社交软件的群名称、即时通讯工具的备注名称以及即时通讯工具的群名称中的若干个。
3.根据权利要求1所述的方法,其特征在于,
当所述文本信息为收货地址时,所述收货地址的筛选条件包括以下一种或多种:收货地址为用户本人使用、收货地址在近期被用户使用过以及收货地址归属于公司类地址。
4.根据权利要求3所述的方法,其特征在于,所述将对应的文本信息与关键词库中的关键词进行精确匹配,若匹配成功,则确定所述文本信息的匹配分数,包括:
从所述收货地址中提取关键性门址;
将所述关键性门址与关键词库中的关键词进行精确匹配;
若匹配成功,则根据在预设时间段内所述收货地址的使用次数,确定对应的交易天数;
将所述交易天数作为所述收货地址的匹配分数。
5.根据权利要求1所述的方法,其特征在于,
当所述文本信息为通讯录时,所述通讯录包括联系人的标注信息及对应的电话号码;所述通讯录的筛选条件包括以下一种或多种:通讯录所属用户的电话号码为所述用户本人使用以及所述电话号码包含在其它通讯录中。
6.根据权利要求5所述的方法,其特征在于,所述将对应的文本信息与关键词库中的关键词进行匹配,若匹配成功,则确定所述文本信息的匹配分数,包括:
从所述通讯录中提取联系人的标注信息;
从所述标注信息中去除不相关词语,所述不相关词语包括联系人的姓名、昵称以及其它无关称谓;
将去除不相关词语后的标注信息与关键词库中的关键词进行精确匹配;
若匹配成功,则确定标注信息中包含所述通讯录所属用户的其它通讯录的个数;
将所述其它通讯录的个数作为所述通讯录的匹配分数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711279551.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种友情链接批量上传方法
- 下一篇:数据访问方法及装置