[发明专利]一种继电保护装置设备数据模型智能分析方法有效
申请号: | 201710541955.1 | 申请日: | 2017-07-05 |
公开(公告)号: | CN107357784B | 公开(公告)日: | 2021-01-26 |
发明(设计)人: | 陈中;邵雷;方国权 | 申请(专利权)人: | 东南大学 |
主分类号: | G06F40/242 | 分类号: | G06F40/242;G06F40/289;G06F40/216;G06F16/31 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
地址: | 210096 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 保护装置 设备 数据模型 智能 分析 方法 | ||
1.一种继电保护装置设备数据模型智能分析方法,其特征在于:包括分词策略、继电保护专用词典机制和改进正向最大匹配算法;
所述分词策略为中文分词与非汉字字符同时处理的分词策略,具体包括以下步骤:
(1.1)初始化待切分字符串和分词结果字符串;
(1.2)判断待分词字符串是否为空;若不为空转步骤1.3;若为空转步骤1.8;
(1.3)取待分词字符串首字符,判断其字符类型;若为英文字符、数字、空格符、回车符和换行符,转步骤1.4;若为非汉字 双字节特殊字符,转步骤1.5;若为中文汉字 字符,转步骤1.6;
(1.4)统计并截取连续的英文字符、数字、空格符、回车符和换行符,共计i个,作为分词结果字符串的自增量,转步骤1.7;
(1.5)统计并截取连续的非汉字双字节特殊字符,共计i个,作为分词结果字符串的自增量,转步骤1.7;
(1.6)统计并截取连续的中文汉字字符,共计i个,作为分词结果字符串的自增量,转步骤1.7;
(1.7)更新待切分字符串,将待分词字符串第i位至最后一位作为新值赋给待分词字符串,转步骤1.2;
(1.8)返回输出分词结果字符串;
所述继电保护专用词典机制为带最大词长的继电保护专用词典机制,所述带最大词长的继电保护专用词典机制在结构上分为三层,包括首字哈希表、词索引表和词典正文;
所述首字哈希表包括首字、最大词长、第一项指针和最末项指针;其中,首字为继电保护专用词典中记录的关键词的第一个字;最大词长用于存储对应首字所有词长中的最大值;第一项指针用于指向首字在索引表中的起始位置;最末项指针用于指向首字在索引表中的最末位置;
所述词索引表包括所有词长和词典正文指针;其中,所有词长为首字对应关键词的所有词长;词典正文指针指向该词长在词典正文中的第一个词的位置;
所述词典正文用于记录继电保护专业的所有关键词;
所述改进正向最大匹配算法为动态获取最大词长的改进正向最大匹配算法,所述动态获取最大词长的改进正向最大匹配算法具体包括以下步骤:
(2.1)初始化待切分字符串和输出词串;
(2.2)判断待切分字符串是否为空;若是为空转步骤2.11;若不为空转步骤2.3;
(2.3)取待切分字符串首字,并获取首字在哈希表中的位置;
(2.4)获取存储在该位置的最大词长;
(2.5)从待切分字符串左边开始,取出候选字符串,候选字符串的长度不大于最大词长;
(2.6)查找词典,判断候选字符串是否在词典中;若是,转步骤2.9;否则转步骤2.7;
(2.7)更新候选字符串,将候选字符串最右边一个字符去掉;
(2.8)判断候选字符串是否为单字;若是,转步骤2.9;否则转步骤2.6;
(2.9)更新输出词串,将候选字符串添加到输出词串;
(2.10)更新待切分字符串,将待切分字符串去除候选字符串的剩余部分赋给待切分字符串,转步骤2.2;
(2.11)返回输出词串。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710541955.1/1.html,转载请声明来源钻瓜专利网。