[发明专利]基于网上商城的用户类别分析方法、装置和计算机设备在审
申请号: | 202010650901.0 | 申请日: | 2020-07-08 |
公开(公告)号: | CN111784403A | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 周兆全;邵延富 | 申请(专利权)人: | 广州市景心科技股份有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06K9/62 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 郭帅 |
地址: | 510630 广东省广州市天河*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 网上商城 用户 类别 分析 方法 装置 计算机 设备 | ||
本发明提供了一种基于网上商城的用户类别分析方法、装置和计算机设备,方法包括获取待分类的用户网上商城消费特征数据;将待分类的用户网上商城消费特征数据输入至预先建立的用户类别分析模型计算得到用户类别;其中,预先建立的用户类别分析模型是采用无监督异常检测算法和聚类算法对历史的用户网上商城消费特征数据进行学习训练得到的。该方法运行过程简单,能快速地确定用户类别;并且采用了无监督异常检测算法和聚类算法大大提成了分析的准确率,从而能实现对用户进行精确的信息推送。
技术领域
本发明涉及数据分类技术领域,具体涉及一种基于网上商城的用户类别分析方法、装置、计算机设备和存储介质。
背景技术
随着电子商务的飞速发展,大大小小的电商平台纷纷通过某些手段建立电商用户画像,以实现精准营销、助理产品与帮助了解行业等。用户画像其实就是希望通过某些手段对用户做甄别,把他们分成彼此相同或不同的人群或个体(例如将其分为特殊用户和普通用户),进而区别化提供服务进行观察分析。例如,淘宝会根据用户使用习惯来决定首页推荐的商品,该举措过滤了一部分垃圾营销,不会给用户带来不悦。不同于大型的电商平台,特定领域电商平台用户类型更集中,用户量也更少,所以建立用户画像时要结合自身平台的特色。在这些特色电商平台中,往往会催生一些“代购”、“买手”(即特殊用户),因此,区分“买手”与普通用户是建立用户类别的第一步。
区分普通用户与特殊用户,可视为一种二分类。一个用户不是普通用户,那就是特殊用户,那么对其进行分类时通常采用二分类算法。然而二分类算法都是监督学习,需要获得有标签的数据,但获得有标签的数据往往成本较高。
发明内容
有鉴于此,本发明提供了一种基于网上商城的用户类别分析方法、装置、计算机设备和存储介质以解决采用现有的二分类算法需要获得有标签的数据成本较高的技术问题。
一种基于网上商城的用户类别分析方法,包括以下步骤:
获取待分类的用户网上商城消费特征数据;
将所述待分类的用户网上商城消费特征数据输入至预先建立的用户类别分析模型计算得到用户类别;其中,所述预先建立的用户类别分析模型是采用无监督异常检测算法和聚类算法对历史的用户网上商城消费特征数据进行学习训练得到的。
进一步地,
在获取待分类的用户网上商城消费特征数据的步骤中,包括:
获取待分类的用户网上商城初始消费特征数据;
对所述取待分类的用户网上商城初始消费特征数据进行清理,去除0或空字段数据、以及异常值数据,得到待分类的用户网上商城消费特征数据。
进一步地,
所述用户类别分析模型的建立,包括:
获取历史的用户网上商城消费特征数据;
对所述历史的用户网上商城消费特征数据进行统计分析,对应得到每个历史用户的各消费特征;
将每个历史用户的各述消费特征输入至所述无监督异常检测算法,对应得到每个历史用户的消费分值;
将每个历史用户的消费分值输入至聚类算法中,确定分类阈值;
根据所述分类阈值对历史的用户打上标签。
进一步地,
所述无监督异常检测算法为孤立森林算法。
进一步地,
所述聚类算法为K-means聚类算法。
进一步地,
获取历史的用户网上商城消费特征数据的步骤中,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州市景心科技股份有限公司,未经广州市景心科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010650901.0/2.html,转载请声明来源钻瓜专利网。