[发明专利]目标群体的显著特征的计算方法、系统及计算机设备在审
申请号: | 201711175498.5 | 申请日: | 2017-11-22 |
公开(公告)号: | CN107818482A | 公开(公告)日: | 2018-03-20 |
发明(设计)人: | 王雪洁 | 申请(专利权)人: | 用友金融信息技术股份有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02 |
代理公司: | 北京友联知识产权代理事务所(普通合伙)11343 | 代理人: | 尚志峰,汪海屏 |
地址: | 100094 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 群体 显著 特征 计算方法 系统 计算机 设备 | ||
技术领域
本发明涉及数据处理技术领域,具体而言,涉及一种目标群体的显著特征的计算方法、系统、计算机设备及计算机可读存储介质。
背景技术
TGI(Target Group Index,目标群体指数/群体偏好度指数)可反映目标群体在特定研究范围(如地理区域、人口统计领域、媒体受众、产品消费者)内的强势或弱势,TGI指数=[目标群体中具有某一特征的群体所占比例/总体中具有相同特征的群体所占比例]×标准数100。通过这个指数可以挖掘出目标群体的显著特征,利用这些显著特征将用户分群,找到精准营销群体,提升用户满意度,降低营销成本。例如,将某酒店的男性的会员作为目标群体,将在该酒店的消费作为他们的相同特征。若酒店的会员中男性的比例为40%,酒店消费的男性顾客比例为20%,那么该酒店的男性会员的TGI指数=40%/20%×100=200,大于100则表明这一特征是显著特征,即数值越大表明这一特性越明显。在这个例子中则表明酒店的会员中大部分为男性顾客,基于此如果我们对来酒店的男性顾客推销会员卡成功的概率更大。
相关技术中,计算TGI的方式有两种:一种是通过人工的方式,根据以往的经验进行筛选,但是这种方式对业务人员的专业性要求很高,很有可能遗漏掉重要的特征点。而且不同的业务人员根据经验判断的结果也不都相同,无法对结果的准确率进行衡量。另一种方式是通过大数据算法进行全维度的遍历。这种方式在现实中的大数据维度的数据下,计算效率无法保证。
发明内容
本发明旨在至少解决现有技术或相关技术中存在的技术问题之一。
为此,本发明的一个方面在于提出了一种目标群体的显著特征的计算方法。
本发明的另一个方面在于提出了一种目标群体的显著特征的计算系统。
本发明的再一个方面在于提出了一种计算机设备。
本发明的又一个方面在于提出了一种计算机可读存储介质。
有鉴于此,根据本发明的一个方面,提出了一种目标群体的显著特征的计算方法,包括:获取目标群体的多个维度特征,其中每个维度特征包括多个类别特征;计算目标群体与每个维度特征之间的相关性,获取多个相关性系数;根据相关性系数对多个维度特征进行筛选,获取多个第一类维度特征;计算第一类维度特征的每个类别特征的群体偏好度指数;比较群体偏好度指数与第一预设阈值的大小关系,将大于第一预设阈值的群体偏好度指数对应的类别特征作为目标群体的显著特征。
本发明提供的目标群体的显著特征的计算方法,首先通过相关系数对所有的维度特征进行初步筛选,即通过比较目标群体与每个维度特征之间的相关性,筛选出与目标群体有关联的维度特征作为第一类维度特征,计算第一类维度特征的每个类别特征的群体偏好度指数,将大于第一预设阈值的群体偏好度指数对应的类别特征作为目标群体的显著特征。本发明可以大大缩短TGI指数的计算时间并且不需要人工的干预,极大的提升了效率,降低了业务门槛。
根据本发明的上述目标群体的显著特征的计算方法,还可以具有以下技术特征:
在上述技术方案中,优选地,计算目标群体与每个维度特征之间的相关性,获取多个相关性系数,具体包括:根据第一公式计算目标群体与每个维度特征之间的相关性,获取多个相关性系数;第一公式为其中,R为相关性系数,X为目标群体数量,Y为具有维度特征目标群体的数量,Cov(X,Y)为目标群体数量与维度特征目标群体的数量的协方差,Var[X]为目标群体数量的方差,Var[Y]为具有维度特征目标群体的数量的方差。
在该技术方案中,相关性系数R是一个处于[-1,1]之间的数值,越接近于1,说明两个变量线性正相关,即随着X的增大,Y也有明显的增大趋势。而越接近-1,说明两个变量线性负相关,即随着X增大,Y有明显的减小的趋势。在0附近则说明两个变量X,Y没有明显的线性关系。
在上述任一技术方案中,优选地,根据多个相关性系数对多个维度特征进行筛选,获取第一类维度特征的步骤,具体包括:分别比较多个相关性系数与第二预设阈值的大小关系;将大于第二预设阈值的相关性系数对应的维度特征作为第一类维度特征,以及将小于或者等于第二预设阈值的相关性系数对应的维度特征作为第二类维度特征。
在该技术方案中,比较多个相关性系数与第二预设阈值的大小关系,关系数大于第二预设阈值时表明二者之间关联性较显著,相关系数低于或者等于第二预设阈值时表明二者之间没有显著的关联性,即第二类维度特征中不会出现目标全体的显著特征,后续不会再对第二类维度特征进行计算,减少了计算资源的浪费,提高了计算效率,并且避免了人工筛选所可能产生的遗漏。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于用友金融信息技术股份有限公司,未经用友金融信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711175498.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电子产品开发需求发布平台
- 下一篇:网络卡券推荐方法及系统