[发明专利]一种基于机器学习算法的输变电设备缺陷数据机器自主聚类工具无效
申请号: | 201210189266.6 | 申请日: | 2012-06-08 |
公开(公告)号: | CN102737350A | 公开(公告)日: | 2012-10-17 |
发明(设计)人: | 李锐海;刘磊;廖永力;杨晴;邓安明;高尚飞;尹福荣;邓丽林;张玉龙;邓全燕;陈达;杨远帜;陆叶 | 申请(专利权)人: | 南方电网科学研究院有限责任公司;昆明能讯科技有限责任公司 |
主分类号: | G06Q50/06 | 分类号: | G06Q50/06 |
代理公司: | 昆明大百科专利事务所 53106 | 代理人: | 何健 |
地址: | 510080 广东省广州市越*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 机器 学习 算法 变电 设备 缺陷 数据 自主 工具 | ||
1.一种基于机器学习算法的输变电设备缺陷数据机器自主聚类工具,其特征在于,它由数据分解器(1)、聚类器(2)、结果处理器(3)依序连接组成;
其中:在数据分解器(1)内分别设置有缺陷数据读取模块、缺陷数据分解模块、缺陷数据获取模块、缺陷数据过滤模块、聚类环境初始化模块;
在聚类器(2)内分别设置有识别判断方法模块、记忆方法及结果模块、问题分析模块、分类处理模块;
在结果处理器(3)内分别设置有数据库信息配置模块、结果结构配置模块、结果文件分发模块、新知识入库模块、老知识更新模块。
2.根据权利要求1所述的一种基于机器学习算法的输变电设备缺陷数据机器自主聚类工具,其特征在于,数据分解器将输变电设备缺陷数据分解成聚类算法能识别的数据;具体分解过程如下:
1)将缺陷数据分为三类:设备缺陷数据={数字数据,中文数据,英文数据},其特征在于,方法是用ASCII码比较每个字符,若存在ASCII码范围外的字符,则判断这个字符串中文,用正则表达式判断如果都是0~9则判断为数字数据;
2)数字数据={编码数字,数值数字},其中代码数字是一种编码代表某种类型,将编码数字对应转化成中文或英文;
3)中文数据分解为词用基于最大匹配算法的两种变体的中文单词识别MMSEG算法实现;
4)英文数据分词用Aho-Corasick算法实现。
3.根据权利要求1所述的一种基于机器学习算法的输变电设备缺陷数据机器自主聚类工具,其特征在于,聚类器包含训练识别方法、记忆方法及结果、问题分析、结果判定过程;
1)练识别方法以词频、反文档算法为方法基础,以支持向量机为机器智能学习算法,以文本样本为知识内容;
2)记忆方法及结果训练后它以文件的方式存储训练结果,以供判断使用;
3)问题分析在训练后它以文件的方式存储训练结果,以供分析判断使用。
4.根据权利要求1所述的一种输变电设备缺陷数据机器自主聚类工具,其特征在于,结果处理器有结果入库、结果文件分发、知识库管理功能,其中结果入库把处理结果添加到数据库,结果文件分发把结果文件分发到不同目标文件夹,知识库管理功能把处理结果添加进知识库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南方电网科学研究院有限责任公司;昆明能讯科技有限责任公司,未经南方电网科学研究院有限责任公司;昆明能讯科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210189266.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种套刻偏差检查标记及其制作方法
- 下一篇:一种产品安全信息追溯系统及方法