[发明专利]基于tri-training的汽车行业潜在客户识别方法有效
申请号: | 201810034618.8 | 申请日: | 2018-01-15 |
公开(公告)号: | CN108256052B | 公开(公告)日: | 2023-07-11 |
发明(设计)人: | 姚黎明;李晓非;张胤 | 申请(专利权)人: | 成都达拓智通科技有限公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/28;G06F18/2431;G06N3/0464;G06N3/084;G06Q30/0201 |
代理公司: | 成都华烨专利代理事务所(普通合伙) 51336 | 代理人: | 严刘英 |
地址: | 610000 四川省成都市武侯区二*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 tri training 汽车行业 潜在 客户 识别 方法 | ||
本发明公开了一种基于tri‑training的汽车行业潜在客户识别方法,包括以下步骤:数据预处理,包括异常值处理、缺失值处理、分类属性处理、组合特征生成、特征选择、数据归一化;数据建模,用半监督学习中的Tri‑Training协同训练算法,并选择BP神经网络作为协同训练过程中的基学习器。本发明利用汽车品牌经销商的历史销售数据(带类别标签的客户数据)与采集的潜在客户数据(无标签的客户数据)建立半监督客户识别模型,从而为汽车行业的精准营销提供准确的营销对象,节省人力成本和资金成本。
技术领域
本发明涉及一种潜在客户识别方法,尤其涉及一种基于tri-training的汽车行业潜在客户识别方法。
背景技术
随着互联网的蓬勃发展与普遍接入,人们在互联网上的行为产生了大量数据,对这些数据的储存、处理、分析等需求带动了数据库、云计算等相关技术的发展,这些数据采集、存储与处理技术的发展又反过来促进了企业对海量数据的分析应用,推动了大数据的发展。当前,越来越多的企业开始重视数据资产的积累、应用和变现。
在汽车行业,各汽车品牌经销商都可以通过手机WAP网站、手机APP、汽车门户电脑网站等数据源获取到近期关注自身品牌或竞争品牌的潜在消费者线索。若汽车品牌经销商能够快速、准确地从这些潜在消费者线索中识别出真正会购买汽车的,或有较大可能性购买汽车的客户,则经销商可以迅速采用更精准的营销方案针对客户进行营销,从而可以在竞争对手之前把握机会,抢占客户,提高销售额。
上述潜在消费者线索通常包括用户浏览过的汽车品牌、汽车型号、在每款汽车页面浏览时长与浏览时间、搜素关键字、价格偏好、用户年龄、居住地等属性。此类数据通常具有数据量大,维数多的特点,且由于用户对自身某些信息的保密性,数据在某些维度上呈现出缺失状态,更重要的一点是这些大量数据是不带有类别标签的,即汽车品牌经销商并不知道这些数据所代表的的用户是否会真正的购买自家汽车。与此同时,汽车品牌经销商在以往的销售中拥有许多同类型的已购买汽车的,即带有类别标签的历史客户数据,通过对两类数据的学习,可以帮助汽车品牌经销商识别每一客户购买汽车的可能性。
在汽车购买客户识别问题当中,传统的解决方法通常有三种:1、汽车经销商指定有经验的销售人员人工观察潜在客户数据并对每一条数据进行打分,分数高低即代表了该客户购买汽车的可能性高低;2、汽车经销商将数据交给第三方数据公司进行客户识别;3、选择常用的有监督模型从已购买汽车的客户数据中学习模型,再对大量无标签的客户数据进行打分。
上述三种传统解决方案均有不足,具体缺陷如下:
方法1:需要指定有经验的销售人员对每一条数据进行打分,而通常潜在客户的数据量是非常大的,且每一天都在产生,人工识别虽然在一定程度上比机器要准确,但是人工识别的速度非常慢,采用模型进行预测可能只需要几分钟,而人工识别可能需要一天甚至几天,因此该方法效率低下,同时也增加了人力成本。
方法2:将潜在客户数据交给第三方数据公司进行识别,由于市场上的第三方数据公司良莠不齐,因此识别结果的准确性难以得到保证,同时这种客户识别是一种长期性的需求,因此从长远看,寻求第三方的资金成本较高,且难以保证第三方能完全遵守数据保密条约,因此存在数据泄露的风险。
方法3:采用常用的有监督模型从已购买汽车的客户数据中学习模型,但在实际中,有标签数据是少量的,这样以少量数据训练得到的模型不能完全抓住数据生成的内在规律,因此模型泛化能力较差,即对于新数据的预测准确性不高,同时也浪费了大量无标签数据中存在的信息。
发明内容
本发明的目的就在于为了解决上述问题而提供一种基于tri-training的汽车行业潜在客户识别方法。
本发明通过以下技术方案来实现上述目的:
一种基于tri-training的汽车行业潜在客户识别方法,包括以下步骤:
步骤(1):数据预处理,包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都达拓智通科技有限公司,未经成都达拓智通科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810034618.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:网站产品生成方法及装置
- 下一篇:一种基于数据增强的主题建模方法