[发明专利]用于生成信息的方法和装置有效
申请号: | 201711139944.7 | 申请日: | 2017-11-16 |
公开(公告)号: | CN107944481B | 公开(公告)日: | 2022-02-18 |
发明(设计)人: | 康建峰;孙健;闻波 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 生成 信息 方法 装置 | ||
1.一种用于生成信息的方法,包括:
采集目标用户的特征信息,并基于业务类型和所述业务类型中所包含的类别将所采集的特征信息划分为至少两个维度,其中,所述特征信息包括用户信息和用户行为信息;
从所述至少两个维度中选取与目标业务类型相关的维度;
基于对所选取的维度中的特征信息的聚类分析,生成目标数目的特征信息集合;
所述方法还包括:
分析各所述特征信息集合中的特征信息,确定各所述特征信息集合的区别特征信息,包括:基于各所述特征信息集合对应的用户画像群中具有第一维度的特征信息的用户画像数量以及所述目标用户中具有第一维度的特征信息的用户数量,确定所述特征信息集合的区别特征信息,其中,所述区别特征信息用于区别所采集的特征信息和所述特征信息集合。
2.根据权利要求1所述的方法,其中,所述基于对所选取的维度中的特征信息的聚类分析,生成目标数目的特征信息集合,包括:
设置K值,其中,K为预设的所述特征信息集合的个数,且K为正整数;
基于所述K值,执行如下聚类步骤:利用所述K值作为聚类算法的初始值对所选取的维度中的特征信息进行聚类分析,生成M个所述特征信息集合,其中,M为正整数;如果M≥K-N,则确定所述特征信息集合的目标数目为M,其中,N为预先设置的可容忍缺失的特征信息集合的个数,且N为正整数;
如果M<K-N,则将K+1作为所述K值继续执行所述聚类步骤。
3.根据权利要求1所述的方法,其中,所述基于各所述特征信息集合对应的用户画像群中具有第一维度的特征信息的用户画像数量以及所述目标用户中具有第一维度的特征信息的用户数量,确定所述特征信息集合的区别特征信息,包括:
分别为各所述特征信息集合建立用户画像群,并根据所述特征信息集合中的特征信息对各所述用户画像群中的用户画像进行多维度描述;
确定每个所述用户画像群中具有第一维度的特征信息的用户画像数量在该所述用户画像群中所占的第一比例,其中,所述第一维度为所述用户画像描述的任一维度;
确定各所述目标用户中具有第一维度的特征信息的用户数量在各所述目标用户中所占的第二比例;
计算所述第二比例与所述第一比例的比值,并按照所述比值从大到小的顺序排列各所述特征信息集合生成特征信息集合队列;
从所述特征信息集合队列中依次获取第一预设数目的所述特征信息集合,将所述第一维度的特征信息作为所获取的特征信息集合的区别特征信息。
4.根据权利要求3所述的方法,其中,所述方法还包括:
确定第一用户画像群中兴趣维度的特征信息的用户画像数量在该所述第一用户画像群中所占的第三比例,其中,所述第一用户画像群为任一所述用户画像群;
响应于判断出所述第三比例大于预设阈值,则确定该所述兴趣维度的特征信息为所述第一用户画像群对应的特征信息集合的区别特征信息。
5.根据权利要求1所述的方法,其中,所述方法还包括:
对所采集的特征信息进行聚类分析,得到多个预留特征信息集合,确定各所述预留特征信息集合的标签;
根据任一所述特征信息集合与各所述预留特征信息集合的相似度,确定该所述特征信息集合的标签。
6.一种用于生成信息的装置,包括:
采集单元,配置用于采集目标用户的特征信息,并基于业务类型和所述业务类型中所包含的类别将所采集的特征信息划分为至少两个维度,其中,所述特征信息包括用户信息和用户行为信息;
选取单元,配置用于从所述至少两个维度中选取与目标业务类型相关的维度;
聚类单元,配置用于基于对所选取的维度中的特征信息的聚类分析,生成目标数目的特征信息集合;
所述装置还包括:
确定单元,配置用于分析各所述特征信息集合中的特征信息,确定各所述特征信息集合的区别特征信息,包括:基于各所述特征信息集合对应的用户画像群中具有第一维度的特征信息的用户画像数量以及所述目标用户中具有第一维度的特征信息的用户数量,确定所述特征信息集合的区别特征信息,其中,所述区别特征信息用于区别所采集的特征信息和所述特征信息集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711139944.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种企业行业分类方法
- 下一篇:一种基于半监督学习的高光谱图像的降维方法
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置