[发明专利]基于半监督学习的销售风险点检测系统、装置有效
申请号: | 201910202920.4 | 申请日: | 2019-03-18 |
公开(公告)号: | CN109978358B | 公开(公告)日: | 2021-08-13 |
发明(设计)人: | 王乾宇;何赛克;郑晓龙;曾大军 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06K9/62 |
代理公司: | 北京市恒有知识产权代理事务所(普通合伙) 11576 | 代理人: | 郭文浩;尹文会 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于机器学习领域,具体涉及了一种基于半监督学习的销售风险点检测方法、系统、装置,旨在解决销售风险点分析效率低、准确率不高、应用场景局限以及大数据环境下难以应用的问题。本发明方法包括:获取数据并构建图数据库;将图数据库中的数据清洗成原始状态;对数据聚类,找出平均轮廓系数接近1时的k值;标记k个聚类数据的特征并设置规则,采用随机森林法分类数据;分析数据之间的相关性,找出风险产品组合;采用知识图谱展示风险点。本发明结合有监督与无监督学习,可以有效地检测出企业可能存在的金融风险并为企业提供建议,优化团队组合,丰富产品搭配。 | ||
搜索关键词: | 基于 监督 学习 销售 风险 检测 系统 装置 | ||
【主权项】:
1.一种基于半监督学习的销售风险点检测方法,其特征在于,包括:步骤S10,基于获取的数据信息构建第一图数据库;所述第一图数据库包括设定类别产品销售数据、对应产品销售人员数据、销售区域数据;步骤S20,基于所述第一图数据库,采用Pandas方法获得原始状态数据,并基于该数据构建第二图数据库;步骤S30,采用K均值聚类法对所述第二图数据库的数据进行聚类,计算平均轮廓系数;获得所述平均轮廓系数接近1时对应的k值和聚类集合;步骤S40,分别提取所述k个聚类集合中各聚类的数据的特征,并利用该特征分别对所述第二图数据库中数据进行标记,获得第三图数据库;步骤S50,按照所述第三图数据库的数据特征设置随机森林决策规则,构建随机森林;采用随机森林分类器对所述第三图数据库进行数据分类,获得第四图数据库;所述随机森林,由对应k个特征的k棵分类树构成;步骤S60,采用Pearson相关系数计算所述第四图数据库各分类数据之间的相关性,输出相关系数值低于预设阈值的产品组合;所述相关系数值低于预设值的产品组合为销售风险点。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910202920.4/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理