[发明专利]面向制造业的客户画像构建方法及装置、计算机存储介质在审
申请号: | 202010565896.3 | 申请日: | 2020-06-19 |
公开(公告)号: | CN111784385A | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 陈曦;赵鑫安;王尔昕;张伟;麻志毅 | 申请(专利权)人: | 杭州未名信科科技有限公司;浙江省北大信息技术高等研究院 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06Q10/10;G06F16/28;G06F16/951;G06K9/62;G06N20/00 |
代理公司: | 北京辰权知识产权代理有限公司 11619 | 代理人: | 付婧 |
地址: | 311200 浙江省杭州市萧*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 制造业 客户 画像 构建 方法 装置 计算机 存储 介质 | ||
本发明公开了面向制造业的客户画像构建方法及装置、计算机存储介质,该客户画像构建方法可包括但不限于从互联网上爬取客户的企业数据,以及利用企业数据生成用于刻画客户性质和企业运营状态的外部标签;读取客户在第一预设时间段内的订购数据,以及利用订购数据生成用于描述客户行为的内部标签;然后根据外部标签和内部标签构建客户画像。该客户画像构建装置包括但不限于外部标签生成模块、内部标签生成模块及客户画像构建模块。本发明构建的面向制造业的客户画像能全面、客观地展示客户的下单行为和企业情况,而且能够为企业辅助提供客户流失风险建议,具有客观性较强、统一性较好及可量化等突出优点。
技术领域
本发明涉及数据处理技术,更为具体来说,本发明涉及面向制造业的客户画像构建方法及装置、计算机存储介质。
背景技术
如今,全球掀起以制造业转型为首要任务的新一轮工业变革。在传统制造业数字化转型的过程中,应用大数据与人工智能技术是推动企业效益稳定增长的新路径。对于面向订单生产(MTO,Make To Order)的制造业企业,企业生产和运营往往要根据客户订单的实际需求开展;其中,实际需求即:客户要什么产品、数量要多少、什么时候要。所以对于面向订单生产的制造业企业,分析和挖掘订单背后的客户实际需求和情况、以维系客户订单规模是重要任务之一。目前,分析和挖掘订单背后的客户情况和需求,这一工作主要通过企业聘请的业务员完成。但是,业务员对客户的判断较为主观,判断结果对业务员的经验和能力依赖比较大;而且不同的人员(包括业务员和决策者)得出的客户分析和挖掘结果往往也不相同,存在主观性较强、结果难统一及无法进行量化等问题。
发明内容
为解决现有对制造业企业的客户的分析和挖掘结果存在较主观、无法统一和量化等问题,本发明提供了一种面向制造业的客户画像构建方法及装置、计算机存储介质。本发明以客户历史订单数据和企业数据为基础,能够结合大数据技术和机器学习技术构建面向制造业企业的客户的画像,达到得到客户分析和挖掘结果的目的,实现为得到客观、统一且可量化的客户分析和挖掘结果提供了较佳的技术方案。
为实现上述技术目的,本发明公开了一种面向制造业的客户画像构建方法,该构建方法包括但不限于如下的步骤。从互联网上爬取客户的企业数据,并利用所述企业数据生成用于刻画客户性质和企业运营状态的外部标签;读取客户在第一预设时间段内的订购数据,并利用所述订购数据生成用于描述客户行为的内部标签;然后根据所述外部标签和所述内部标签构建客户画像。
进一步地,所述订购数据包括历史订单数据;该方法包括还根据随机森林模型预测的客户流失风险值构建客户画像;随机森林模型的建立过程包括:对所有历史订单数据进行无量纲化预处理,以得到第一数据集;对所述第一数据集进行特征扩展,然后从扩展后的第一数据集中提取重要性高于或等于第一数据集内剩余特征的多个特征,以得到第二数据集;将所述第二数据集划分为训练集和测试集,基于所述训练集和测试集建立用于预测客户流失风险值的随机森林模型。
进一步地,建立用于预测客户流失风险值的随机森林模型的过程包括:通过所述训练集和所述测试集生成多棵决策树;利用所述多棵决策树形成随机森林模型。
进一步地,生成多棵决策树的过程包括:采用有放回地随机采样的方式从所述训练集中选出n个样本,从所述多个特征中随机选取k个特征,利用所述n个样本和所述k个特征生成待测试的决策树;利用所述测试集计算所述待测试的决策树存在的误差,并将误差小于设定值的决策树作为形成所述随机森林模型的决策树。
进一步地,预测客户流失风险值的过程包括:令新的历史订单数据分别经过随机森林模型中的每棵决策树,以得到多个决策结果,将所有决策结果中得到投票数最多的决策结果作为客户流失风险值。
进一步地,读取客户在第一预设时间段内的订购数据的过程包括:将历史订单数据按时间顺序存储至订单新表中;其中,按照设定频率对所述订单新表进行更新,更新过程中删除订单新表第二预设时间段内的数据以及将第二预设时间段内的最新订单数据插入至所述订单新表中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州未名信科科技有限公司;浙江省北大信息技术高等研究院,未经杭州未名信科科技有限公司;浙江省北大信息技术高等研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010565896.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据查询方法及系统
- 下一篇:一种斜拉桥分丝管索鞍的除湿结构及除湿系统