[发明专利]一种基于机器学习的销售系统客户匹配方法有效
申请号: | 202110748337.0 | 申请日: | 2021-06-30 |
公开(公告)号: | CN113379432B | 公开(公告)日: | 2022-07-19 |
发明(设计)人: | 王浩栋;姜平 | 申请(专利权)人: | 焦点科技股份有限公司 |
主分类号: | G06Q30/00 | 分类号: | G06Q30/00;G06N20/00 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 陈建和 |
地址: | 210032 江苏省南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 机器 学习 销售 系统 客户 匹配 方法 | ||
1.一种基于机器学习的销售系统客户匹配方法,其特征在于,包括如下步骤:
步骤一,对销售系统中客户信息进行数据探索,得到客户信息;
步骤二,对所述客户信息做数据预处理,得到训练集和测试集;
步骤三,将训练集和测试集中的字符串特征输入LDA主题模型进行主题分类;
步骤四,设计样本,所述样本用于模型的训练;
所述步骤四中,所述样本设计中的样本包括相对应的第一正、负样本,和相对应的第二正、负样本,所述第一正样本为有销售记录的客户信息,第一负样本为没有销售记录的客户信息;所述第二正样本为在预设时间范围内有销售ID的联系记录和购买记录的客户信息;第二负样本为在预设时间范围内有销售ID的联系记录但无购买记录的客户信息;
步骤五,以GBDT+LR的构建方式构建第一模型与第二模型,所述第一模型与第二模型使用样本进行训练,所述第一模型根据样本中的客户信息预测客户的成交可能性,所述第二模型根据样本中的客户信息和第一模型输出的成交可能性,预测销售与客户的匹配概率;
所述步骤五中,所述第一模型包括第一GBDT特征选择模型和第一LR模型,所述第二模型包括第二GBDT特征选择模型和第二LR模型,所述第一GBDT特征选择模型与第二GBDT特征选择模型均使用sklearn机器学习框架下的GradientBoostingClassifier进行数据特征选择训练,对输出结果使用OneHotEncoder进行独热编码处理,处理后的向量和样本使用sklearn中的LogisiticRegression进行训练,所述第一GBDT特征选择模型使用第一正、负样本,所述第二GBDT特征选择模型使用第二正、负样本;
步骤六,将待测客户信息依次输入第一模型与第二模型,输出客户与各销售的匹配概率。
2.如权利要求1所述的一种基于机器学习的销售系统客户匹配方法,其特征在于,所述步骤一中的数据探索具体为:从销售系统中提取客户信息,所述客户信息中的属性特征包括:客户ID、销售ID、联系记录、购买记录、电话、传真、客户来源、经营范围、公司人员规模、公司注册资本、公司类型、所在地、客户成交可能性。
3.如权利要求2所述的一种基于机器学习的销售系统客户匹配方法,其特征在于,所述步骤二中,所述数据预处理包括:删除属性特征中缺失的字符串,对无实质意义的属性特征进行离散特征转化,将结果转化为0,1标签,对客户来源,公司类型进行标签统计并转化为虚拟变量,对公司人员规模和公司注册资本进行数据探索,划分数据区间,对数据区间转化虚拟变量,使用sklearn的train_test_split功能将客户信息分割成训练集和测试集。
4.如权利要求3所述的一种基于机器学习的销售系统客户匹配方法,其特征在于,所述步骤三中,通过perplexity计算和卡方检验对LDA主题模型定量调参,所述定量调参的用词数目为7500词,主题数目为30。
5.如权利要求4所述的一种基于机器学习的销售系统客户匹配方法,其特征在于,所述步骤二中,数据预处理还包括:对中英文混杂的省份名称,处理为中文加英文的格式,统一公司注册资本中不同货币的单位,通过实时汇率转化为以万元人民币为单位的数据;所述无实质意义的属性特征包括:电话、传真,没有电话或传真为0,反之为1。
6.如权利要求5所述的一种基于机器学习的销售系统客户匹配方法,其特征在于,所述步骤五中,使用sklearn 的GridSearch对第一GBDT特征选择模型和第二GBDT特征选择模型全局调参,得到random_state:10、learning_rate:0.1、n_estimators:100、max_depth:5、min_samples_split:300、min_samples_leaf:20、max_features:301、subsample:1.0的第一GBDT特征选择模型,和random_state:10、learning_rate:0.1、n_estimators:200、max_depth:5、min_samples_split:500、min_samples_leaf:80、subsample:1.0的第二GBDT特征选择模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于焦点科技股份有限公司,未经焦点科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110748337.0/1.html,转载请声明来源钻瓜专利网。