[发明专利]用于生成信息的方法和装置有效
申请号: | 201711139944.7 | 申请日: | 2017-11-16 |
公开(公告)号: | CN107944481B | 公开(公告)日: | 2022-02-18 |
发明(设计)人: | 康建峰;孙健;闻波 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 生成 信息 方法 装置 | ||
本申请实施例公开了用于生成信息的方法和装置。该方法的一具体实施方式包括:采集目标用户的特征信息,并将所采集的特征信息划分为至少两个维度,其中,特征信息包括用户信息和用户行为信息;从多个维度中选取与目标业务类型相关的维度;基于对所选取的维度中的特征信息的聚类分析,生成目标数目的特征信息集合。该实施方式通过利用目标用户的特征信息可以生成任一业务类型用户对应的特征信息集合,提高了信息生成方法的通用性。
技术领域
本申请实施例涉及计算机技术领域,具体涉及互联网技术领域,尤其涉及用于生成信息的方法和装置。
背景技术
不同业务对不同的用户群需要提供个性化的信息推送等服务,因此,不同业务在为用户群提供信息推送等服务之前,必须要对用户群有一个了解。为了实现各行业对用户群的了解,我们往往需要借助用户的用户信息和用户行为信息等方面的特征信息,并对用户的特征信息进行集合划分,从而实现为用户提供个性化的服务和产品。现有技术中,通常需要通过设计与业务类型相关的人群问卷或在相关网站进行埋点等方式获取用户的特征信息来生成用户的特征信息集合。并且对于不同类型的业务,通常需要采用不同的人群问卷或网站埋点获取用户的特征信息来生成用户的特征信息集合。
发明内容
本申请实施例提出了用于生成信息的方法和装置。
第一方面,本申请实施例提供了一种用于生成信息的方法,该方法包括:采集目标用户的特征信息,并将所采集的特征信息划分为至少两个维度,其中,特征信息包括用户信息和用户行为信息;从多个维度中选取与目标业务类型相关的维度;基于对所选取的维度中的特征信息的聚类分析,生成目标数目的特征信息集合。
在一些实施例中,方法还包括:分析各特征信息集合中的特征信息,确定各特征信息集合的区别特征信息,其中,区别特征信息用于区别所采集的特征信息和特征信息集合。
在一些实施例中,基于对所选取的维度中的特征信息的聚类分析,生成目标数目的特征信息集合,包括:设置K值,其中,K为预设的特征信息集合的个数,且K为正整数;基于K值,执行如下聚类步骤:利用K值作为聚类算法的初始值对所选取的维度中的特征信息进行聚类分析,生成M个特征信息集合,其中,M为正整数;如果M≥K-N,则确定特征信息集合的目标数目为M,其中,N为预先设置的可容忍缺失的特征信息集合的个数,且N为正整数;如果M<K-N,则将K+1作为K值继续执行聚类步骤。
在一些实施例中,分析各特征信息集合中的特征信息,确定各特征信息集合的区别特征信息,包括:分别为各特征信息集合建立用户画像群,并根据特征信息集合中的特征信息对各用户画像群中的用户画像进行多维度描述;确定每个用户画像群中具有第一维度的特征信息的用户画像数量在该用户画像群中所占的第一比例,其中,第一维度为用户画像描述的任一维度;确定各目标用户中具有第一维度的特征信息的用户数量在各目标用户中所占的第二比例;计算第二比例与第一比例的比值,并按照比值从大到小的顺序排列各特征信息集合生成特征信息集合队列;从特征信息集合队列中依次获取第一预设数目的特征信息集合,将第一维度的特征信息作为所获取的特征信息集合的区别特征信息。
在一些实施例中,方法还包括:确定第一用户画像群中兴趣维度的特征信息的用户画像数量在该第一用户画像群中所占的第三比例,其中,第一用户画像群为任一用户画像群;响应于判断出第三比例大于预设阈值,则确定该兴趣维度的特征信息为第一用户画像群对应的特征信息集合的区别特征信息。
在一些实施例中,方法还包括:对所采集的特征信息进行聚类分析,得到多个预留特征信息集合,确定各预留特征信息集合的标签;根据任一特征信息集合与各预留特征信息集合的相似度,确定该特征信息集合的标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711139944.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种企业行业分类方法
- 下一篇:一种基于半监督学习的高光谱图像的降维方法
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置