[发明专利]一种维修厂分类方法及装置有效
申请号: | 201811160539.8 | 申请日: | 2018-09-30 |
公开(公告)号: | CN109472370B | 公开(公告)日: | 2021-09-10 |
发明(设计)人: | 刘新;张小琼 | 申请(专利权)人: | 深圳市元征科技股份有限公司 |
主分类号: | G06Q10/00 | 分类号: | G06Q10/00;G06Q30/00;G06Q30/02;G06K9/62 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 518000 广东省深圳市龙*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 维修厂 分类 方法 装置 | ||
本申请实施例公开了维修厂分类方法以及相关装置。根据n个维修厂的特征信息,分别构建所述n个维修厂对应的n个特征信息集合;从所述n个特征信息集合中确定L个目标特征信息集合对应的C类标签;且每个目标特征信息集合对应一个标签;根据所述L个目标特征信息集合和所述L个目标特征信息集合对应的C类标签,通过标签传播算法LPA确定(n‑L)个未标记特征信息集合中任意一个特征信息集合在所述C类标签中对应的标签。本申请实施例提供的维修厂分类方法,通过少量的标记维修厂数据预测并确定大量未标记数据对应的维修厂类别,降低数据挖掘难度,分类更客观、合理。
技术领域
本申请涉及数据挖掘技术领域,尤其涉及一种维修厂分类方法及装置。
背景技术
维修厂直接向消费者提供各类服务,其专业水平、服务质量影响着消费者的体验。针对各个维修厂的大量数据,区分出不同专业水平、服务质量的维修厂,具有强大的现实意义。
目前,基于线性回归监督学习模型和专家系统的分类方法,分类规则不统一,导致结果偏差较大,并且分类结果与数据特征线性相关性弱。监督学习算法,对获取的大量客观的已标记维修厂数据,训练机器学习模型,并确立分类方法;实际中,获取大量客观的已标记数据很困难,需要大量人力、物力、财力的投入。另一种基于K均值聚类无监督学习算法的分类方法,对输入的数据要求高,而且分类结果的实际意义具有不确定性。另外,无监督学习算法直接对未标记的原始维修厂数据进行建模分类,其结果可能不具客观性,实用性值得怀疑。
如何通过少量的标记维修厂数据预测并确定大量未标记维修厂数据,再确定维修厂的类别,使得分类结果与数据特征吻合,降低数据处理难度,得出更客观、合理的分类结果,是本申请需解决的问题。
发明内容
本申请实施例提供的维修厂分类方法,通过少量的标记维修厂数据预测并确定大量未标记数据对应的维修厂类别,降低数据挖掘难度,分类更客观、合理。
第一方面,本申请实施例提供了一种维修厂分类方法,可包括:
根据n个维修厂的特征信息,分别构建所述n个维修厂对应的n个特征信息集合;其中,n为大于0的整数;从所述n个特征信息集合中确定L个目标特征信息集合对应的C类标签;其中,L为大于0且小于n的整数,C为小于或者等于L的正整数,且每个目标特征信息集合对应一个标签;根据所述L个目标特征信息集合和所述L个目标特征信息集合对应的C类标签,通过标签传播算法LPA确定(n-L)个未标记特征信息集合中任意一个特征信息集合在所述C类标签中对应的标签;所述(n-L)个未标记特征信息集合为所述n个特征信息集合中除所述L个目标特征信息集合外的特征信息集合;其中,(n-L)为大于0且小于n的整数。
通过实施本申请实施例,构建的n个特征信息集合,能够反映n个维修厂的各方面情况;标记所述n个特征信息集合中的L个目标特征信息集合,引入标签,弥补了无监督学习算法的缺陷;根据标签传播算法LPA标记大量未标记的特征信息集合,避免过多的成本投入。本申请实施例降低数据挖掘难度,得出的分类结果更客观、合理。
在一种可能的实现方式中,所述n个特征信息集合,可包括:
从所述n个维修厂的特征信息分别构建的画像中确定的特征信息集合。
在一种可能的实现方式中,所述从所述n个特征信息集合中确定L个目标特征信息集合对应的C类标签,可包括:
按照预设的抽样规则,确定所述L个目标特征信息集合;所述L个目标特征信息集合的标签有C类;所述抽样规则,可以包括:对区域进行划分,结合划分的各个区块的面积、人口等特点,合理抽样得到具有代表性的样本;
按照预设的标记方法,标记所述L个目标特征信息集合的标签;所述预设的标记方法,可以包括:结合特征信息集合的内容和标记方案,由人工对所述L个目标特征信息集合进行标记;或者,结合专家知识和相关的标记规则,由机器对所述L个目标特征信息集合进行标记。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市元征科技股份有限公司,未经深圳市元征科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811160539.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电力设备的监测方法及装置
- 下一篇:一种大型桥梁结构运营管理系统及方法
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理