[发明专利]基于半监督学习的销售风险点检测系统、装置有效
申请号: | 201910202920.4 | 申请日: | 2019-03-18 |
公开(公告)号: | CN109978358B | 公开(公告)日: | 2021-08-13 |
发明(设计)人: | 王乾宇;何赛克;郑晓龙;曾大军 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06K9/62 |
代理公司: | 北京市恒有知识产权代理事务所(普通合伙) 11576 | 代理人: | 郭文浩;尹文会 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 监督 学习 销售 风险 检测 系统 装置 | ||
本发明属于机器学习领域,具体涉及了一种基于半监督学习的销售风险点检测方法、系统、装置,旨在解决销售风险点分析效率低、准确率不高、应用场景局限以及大数据环境下难以应用的问题。本发明方法包括:获取数据并构建图数据库;将图数据库中的数据清洗成原始状态;对数据聚类,找出平均轮廓系数接近1时的k值;标记k个聚类数据的特征并设置规则,采用随机森林法分类数据;分析数据之间的相关性,找出风险产品组合;采用知识图谱展示风险点。本发明结合有监督与无监督学习,可以有效地检测出企业可能存在的金融风险并为企业提供建议,优化团队组合,丰富产品搭配。
技术领域
本发明属于机器学习领域,具体涉及了一种基于半监督学习的销售风险点检测系统、装置。
背景技术
当今中国正处在互联网经济飞速发展时期,科技创新成为了社会极为重要的需求,对未来经济的增长将起到奠定性作用。机器学习技术自20世纪50年代以来,历时60多年的发展,已经在各行业各领域的大数据分析预测方面显露头角,大数据在互联网时代所蕴含的内在价值得以不断被挖掘,其中的价值已引起各国政府、企业界、学术界的高度重视。我们可以依据多个维度的数据或单维的数据对企业行业进行全方位多角度的挖掘剖析。
针对销售风险问题,多数金融机构企业通常采用调研、统计、分析等传统方法。这一类方法对已发生的风险问题进行溯源,找到现存问题,或对可能出现的问题进行预判,提前预知未来风险。然而,传统方法没有结合大数据和机器学习的相关技术,难以挖掘出深层潜在问题,同时传统方法应用范围领域过于狭窄,无法兼顾效率与准确率。随着互联网影响力的不断加深以及移动终端设备的广泛普及,大数据的价值不断体现,机器学习相关技术在金融领域的应用日益增多,但绝大多数应用仅限于银行、证券、保险行业等专业性金融场景,而传统行业金融数据仍然具备极大的可挖掘价值。
发明内容
为了解决现有技术中的上述问题,即为了解决销售风险点分析效率低、准确率不高、应用场景局限以及大数据环境下难以应用的问题,本发明的第一方面,提供了一种基于半监督学习的销售风险点检测方法,包括:
步骤S10,基于获取的数据信息构建第一图数据库;所述第一图数据库包括设定类别产品销售数据、对应产品销售人员数据、销售区域数据;
步骤S20,基于所述第一图数据库,采用Pandas方法获得原始状态数据,并基于该数据构建第二图数据库;
步骤S30,采用K均值聚类法对所述第二图数据库的数据进行聚类,计算平均轮廓系数;获得所述平均轮廓系数接近1时对应的k值和聚类集合;
步骤S40,分别提取所述k个聚类集合中各聚类的数据的特征,并利用该特征分别对所述第二图数据库中数据进行标记,获得第三图数据库;
步骤S50,按照所述第三图数据库的数据特征设置随机森林决策规则,构建随机森林;采用随机森林分类器对所述第三图数据库进行数据分类,获得第四图数据库;所述随机森林,由对应k个特征的k棵分类树构成;
步骤S60,采用Pearson相关系数计算所述第四图数据库各分类数据之间的相关性,输出相关系数值低于预设阈值的产品组合;所述相关系数值低于预设值的产品组合为销售风险点。
在一些优选的实施例中,步骤S30中“对所述第二图数据库的数据进行聚类”之前还设置有坏点数据去除的步骤,包括:
步骤M10,计算相应产品的销售数据的加权平均值:
其中,为销售数据的加权平均值,x1、x2……xt为对应的各类产品,f1、f2……ft为相应产品的函数值,t为产品总数量;
步骤M20,销售数据的加权平均值高于预设阈值的对应的销售数据为坏点数据,删除所述坏点数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910202920.4/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理