[发明专利]一种群画像方法、群画像装置及服务器有效
申请号: | 201710296753.5 | 申请日: | 2017-04-28 |
公开(公告)号: | CN108804454B | 公开(公告)日: | 2021-12-10 |
发明(设计)人: | 罗奎 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F16/735 | 分类号: | G06F16/735;H04N21/25 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 种群 画像 方法 装置 服务器 | ||
1.一种群画像方法,其特征在于,包括:
获取给定群的用户特征信息及对比数据,所述对比数据为非给定群的用户特征信息,所述给定群的用户特征信息包括给定群特征;
根据频繁模式算法对所述给定群的用户特征信息进行处理,得到至少一个频繁项集,每个频繁项集都包括给定群特征及特征集;
根据所述至少一个频繁项集生成至少一个关联推导式,一个关联推导式对应一个频繁项集,关联推导式包括后置项及前置项,所述后置项为所述关联推导式对应的频繁项集中的给定群特征,所述前置项为所述关联推导式对应的频繁项集中的特征集;
根据所述对比数据及所述至少一个频繁项集计算出所述至少一个关联推导式中每一个关联推导式的置信度信息,及所有关联推导式中前置项的支持度信息,所述支持度信息为所述前置项在所述给定群的用户特征信息及所述对比数据中出现的次数,所述关联推导式的置信度信息为所述至少一个关联推导式中关联推导式的前置项的支持度值及对应的前置项和后置项同时出现的支持度值的比值;
根据所述置信度信息及所述支持度信息得到所述给定群的群画像,所述给定群的群画像为一个关联推导式的前置项,所述前置项为从至少一个关联推导式中选择一个关联推导式对应的频繁项集中的特征集。
2.根据权利要求1所述的群画像方法,其特征在于,所述根据频繁模式算法对所述给定群的用户特征信息进行处理,得到至少一个频繁项集,包括:
获取所述给定群的用户特征信息中所有用户特征的支持度值,所述支持度值为对应的用户特征的出现次数,所述用户特征包括给定群特征;
获取支持度值大于或等于预置最小支持度阈值的用户特征;
根据支持度降序排序规则生成频繁项列表,所述频繁项列表包括至少一个用户特征及每一个用户特征对应的支持度值;
根据所述频繁项列表构建频繁模式树,所述频繁模式树的包括根节点及分支节点,所述根节点为无效值,所述分支节点对应一个用户特征及其支持度值;
选取一个分支节点作为后缀节点,查询所述频繁模式树中包含所述后缀节点的至少一个树分支路径;
获取所述至少一个树分支路径中每一条树分支路径的所有分支节点对应的用户特征及其支持度值,递归获取至少一个频繁项集,每个频繁项集包括给定群特征及特征集,所述特征集包括所述后缀节点对应的用户特征。
3.根据权利要求2所述的群画像方法,其特征在于,所述根据所述至少一个频繁项集生成至少一个关联推导式,包括:
将所述至少一个频繁项集中每个频繁项集的特征集设置为前置项,及每个频繁项集的给定群特征设置为后置项;
根据所述至少一个频繁项集中每个频繁项集对应的前置项和后置项生成至少一个关联推导式,一个关联推导式对应一个频繁项集。
4.根据权利要求1所述的群画像方法,其特征在于,所述根据所述对比数据及所述至少一个频繁项集计算出所述至少一个关联推导式中每一个关联推导式的置信度信息,及所有关联推导式中前置项的支持度信息,包括:
获取所述至少一个关联推导式中每一个关联推导式的前置项在所述对比数据和所述至少一个频繁项集中出现的次数,得到所述每一个关联推导式中前置项的支持度值;
根据所述每一个关联推导式中前置项的支持度值得到所有关联推导式中前置项的支持度信息;
获取所述至少一个关联推导式中每一个关联推导式的前置项和后置项都在所述对比数据和所述至少一个频繁项集中出现的次数,得到所述每一个关联推导式中前置项和后置项同时出现的支持度值;
将所述至少一个关联推导式中关联推导式Y的前置项的支持度值及对应的前置项和后置项同时出现的支持度值带入X=A/B,所述B表示所述关联推导式Y中前置项的支持度值,所述A表示所述关联推导式Y中前置项和后置项同时出现的支持度值,所述X表示所述关联推导式Y的置信度值;
计算得到所述关联推导式Y的置信度值X,并根据所有关联关系推导式的置信度值生成置信度信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710296753.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种视音频识别方法及装置
- 下一篇:一种数据排序方法及装置