[发明专利]相似人群扩展方法、装置及电子设备在审
申请号: | 201711365936.4 | 申请日: | 2017-12-18 |
公开(公告)号: | CN108109004A | 公开(公告)日: | 2018-06-01 |
发明(设计)人: | 范驰;刘友强;齐晓旭 | 申请(专利权)人: | 北京三快在线科技有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06K9/62 |
代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 王卫忠;袁礼君 |
地址: | 100083 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 人群 类间距离 类内距离 行业类别 预设条件 申请 装置及电子设备 电子设备 扩展装置 算法效率 特征维度 精准度 样本 | ||
本申请公开了一种相似人群扩展方法,包括:根据行业类别获得所述行业类别对应的样本的多个特征,所述特征包括特征维度及特征值;获得每个特征对应的类间距离以及类内距离;判断所述类间距离以及类内距离是否满足预设条件;如果所述类间距离以及类内距离满足预设条件,则选择所述特征进行相似人群扩展。本申请还涉及一种相似人群扩展装置及电子设备。采用本申请的技术方案,可以提高相似人群扩展的算法效率,并且提高人群扩展的精准度。
技术领域
本申请涉及通信技术领域,具体而言,涉及一种相似人群扩展方法、装置及电子设备。
背景技术
目前,为满足广告主投广告的需求,互联网领域已经有一些技术可以提供“相似人群拓展(Looklike)功能”。该功能基于广告主拥有的种子用户数据(可以是线上产生过交易行为的用户,也可以是线下通过预约、到店消费等确定的用户等)。相似人群扩展算法可以基于种子用户(如果是线下交易的用户,需要先通过一定的方式进行id的映射,从而找到线上的对应的用户)的画像寻找相似的用户,从而自动实现规模化的拓展,帮助广告主高效地找到潜在的用户。让广告主找到用户这件事情变得高效精确的同时,又保证了广告曝光具有一定的量。
互联网广告的优势在于能够获得丰富的用户特征(通常高达数千个维度),这些特征不仅包括基本的人口属性,如性别、年龄、教育程度、婚姻状况等,还包括用户的兴趣偏好、行为偏好(热爱购买化妆品、喜欢吃日料等)、以及用户之间的关系链等。这些丰富的数据为相似人群扩展功能提供了坚实的基础。同时,广告主所属的行业领域是非常广阔的,如餐饮类、休闲娱乐类、日化类(化妆品等)、快消类、银行类(信用卡申请等)等,不同行业之间业务差异显著。如餐饮类的的广告主希望投放给具备一定的消费能力且有外出就餐习惯的人群。特别地,对于地方特色的餐厅而言,用户的口味偏好是非常重要的特征。而丽人(如美甲、美睫)广告主一般认为青年、中年女性是其目标用户,此时性别这个特征相对其他特征而言就尤为重要。而信用卡开卡等广告则较为重视用户的经济能力,性别和口味偏好的因素在这里起的作用较小。
当前的相似人群扩展方法一般会通过选取非常多的特征维度(数千维特征)来进行相似度计算,以充分利用海量数据来进行人群扩展。但是,采用通用的特征维度计算用户的相似度并进行人群扩展,不能很好地体现行业的差异以及与之关联的特征重要性的差异。例如,目前互联网广告主行业跨度较大,涉及到的行业类别有餐饮、休娱、丽人、快消、日化、游戏等。不同行业的广告主对于同一特征的重视程度的差异是非常大的。采用同样的特征维度进行人群扩展,无法体现不同行业对于某一特征的关注度差异显著的现状。从而不能针对不同行业的特点,挖掘出最适合该行业广告主投放的用户。
而且,引入过多的特征会导致“维数灾难”,不仅会影响计算效率,而且在样本有限的情况下,过多的特征维度还可能会导致扩展效果的降低。甚至在某些情况下,采用和行业相关度较小的特征进行相似人群扩展,对于人群扩展的质量的保证力度不足,某些特征甚至对相似度的计算会起到相反的作用。
申请内容
针对现有技术中存在的问题,本申请提供一种相似人群扩展方法、装置和电子设备。
本申请一实施例提供一种相似人群扩展方法,包括:
根据行业类别获得所述行业类别对应的样本的多个特征,所述特征包括特征维度及特征值;
获得每个特征对应的类间距离以及类内距离;
判断所述类间距离以及类内距离是否满足预设条件;
如果所述类间距离以及类内距离满足预设条件,则选择所述特征进行相似人群扩展。
本申请实施例还提供一种相似人群扩展装置,包括:
第一获取模块,用于根据行业类别获得所述行业类别对应的样本的多个特征,所述特征包括特征维度及特征值;
第二获取模块,用于获得每个特征对应的类间距离以及类内距离;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711365936.4/2.html,转载请声明来源钻瓜专利网。