[发明专利]用户子女情况判断方法、服务器及计算机可读存储介质有效
申请号: | 202010008820.0 | 申请日: | 2020-01-02 |
公开(公告)号: | CN111242723B | 公开(公告)日: | 2020-09-15 |
发明(设计)人: | 喻宁;史良洵;陈克炎;朱园丽;朱艳乔;陈皓云 | 申请(专利权)人: | 平安科技(深圳)有限公司;中国平安财产保险股份有限公司 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06Q50/00;H04W4/029 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 子女 情况 判断 方法 服务器 计算机 可读 存储 介质 | ||
本发明涉及一种数据分析技术,揭露了一种用户子女情况判断方法,该方法包括:采集用户在预设时间段内的LBS轨迹数据;获取预设范围内的POI数据;将用户的LBS轨迹数据和POI数据进行匹配,分析出用户在预设类型的活动场所出现的特征信息;根据所述特征信息,采用随机森林算法对用户进行社交群体的划分;获取所述社交群体中用户的年龄信息;根据各个社交群体中用户的年龄差判断用户子女情况,并建立用户的子女标签。本发明还提供一种服务器及计算机可读存储介质。本发明能够通过LBS轨迹数据对目标人群进行智能化信息采集,减轻人力劳动及节约成本,并根据所采集的数据和用户的年龄信息判断用户是否有子女,从而更容易地对用户进行有针对性的消费推荐。
技术领域
本发明涉及数据分析技术领域,尤其涉及一种用户子女情况判断方法、服务器及计算机可读存储介质。
背景技术
目前,业内对于如何确定用户是否有子女的情况,都是通过单独的个人信息采集,如问卷调查、保险等级等方式来询问用户是否有子女。这种方法非常复杂,需要经过被采集人的同意且愿意去填写子女情况,采集到的信息不全面,且真实性不高。并且,在采集后需要有专门的负责人对采集的数据进行整理和归档。在这个过程中,存在着简单且机械重复的人力劳动,效率非常低,且可能出现人为失误,容易造成人力和时间的浪费。以上情况将影响最后判断结果的准确性和及时性,导致对用户进行错误的消费推荐。
因此,如何在克服以上不足的情况下,提供一种有效的判断用户是否有子女的处理方案,已经成为一个亟待解决的技术问题。
发明内容
有鉴于此,本发明提出一种用户子女情况判断方法、服务器及计算机可读存储介质,以解决以上技术问题。
首先,为实现上述目的,本发明提出一种用户子女情况判断方法,该方法包括步骤:
采集用户在预设时间段内的基于位置的服务LBS轨迹数据;
获取预设范围内的兴趣点POI数据;
将用户的LBS轨迹数据和所述POI数据进行匹配,分析出用户在预设类型的活动场所出现的特征信息;
根据用户在预设类型的活动场所出现的所述特征信息,采用随机森林算法对用户进行社交群体的划分;
获取所述社交群体中用户的年龄信息;及
根据各个所述社交群体中用户的年龄差判断用户子女情况,并建立用户的子女标签。
可选地,该方法在采集到所述用户LBS轨迹数据后还包括步骤:
使用数据清洗技术对所采集的用户LBS轨迹数据进行预处理,包括检查数据一致性,处理无效值和缺失值。
可选地,该方法在分析出用户在预设类型的活动场所出现的特征信息之后还包括步骤:
基于Fisher准则和χ2检验的筛选变量算法,剔除与用户子女情况判断无关的特征。
可选地,所述POI和所述预设类型的活动场所主要包括亲子类活动场所。
可选地,所述特征信息包括用户的设备号、出现的每个所述预设类型的活动场所、在各活动场所出现的次数、出现的时间点、花费的时长。
可选地,所述采用随机森林算法对用户进行社交群体的划分的步骤包括:根据每个用户的所述特征信息,针对用户在所述活动场所出现的时间、位置和出现次数作为分区特征,将同时出现在一个活动场所的不同用户进行社交群体的分类。
可选地,所述根据各个社交群体中用户年龄差判断用户子女情况的步骤包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司;中国平安财产保险股份有限公司,未经平安科技(深圳)有限公司;中国平安财产保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010008820.0/2.html,转载请声明来源钻瓜专利网。