[发明专利]电力调控系统多源异构数据融合中的字符串匹配方法在审
申请号: | 201710079131.7 | 申请日: | 2017-02-14 |
公开(公告)号: | CN106919663A | 公开(公告)日: | 2017-07-04 |
发明(设计)人: | 唐良瑞;樊冰;王瑞杰;吴润泽;陈文伟 | 申请(专利权)人: | 华北电力大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q50/06 |
代理公司: | 北京华谊知识产权代理有限公司11207 | 代理人: | 刘月娥 |
地址: | 10220*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电力 调控 系统 多源异构 数据 融合 中的 字符串 匹配 方法 | ||
技术领域
本发明属于电力调度控制系统多源异构数据融合技术领域,特别是提供了一种电力调控系统多源异构数据融合中的字符串匹配方法。
背景技术
近年来,随着电力信息化的推进与智能电网的发展,电力系统运行、调度与控制中数据来源十分广泛,同时,数据的规模越来越大和种类也在快速增长。其中,这些数据的数据源不仅包括用电信息采集系统、营销系统、广域监测系统(wide area measurement system,WAMS)、配电管理系统、生产管理系统、能量管理系统(energy management system,EMS)、设备检测和监测系统、客户服务系统、财务管理系统等内部数据源,还包括气象信息系统、地理信息系统、公共服务部门等外部数据源。这些电力系统运行与控制中产生的数据具有如下特征:①数据规模大,②数据类型多样化,③数据产生的速率快,④数据的价值密度低,⑤数据安全性高。这些数据之间并非完全独立,不同系统、类型的数据之间存在着复杂的相关性。面对海量的复杂电力大数据,传统的数据共享技术、数据处理技术在数据存储、查询与分析等方面遇到瓶颈,因此,亟需开展研究应用于电力大数据共享、融合、存储、查询、数据挖掘分析等方面的大数据相关技术。电力调度控制系统是电力企业中的主要系统之一。电力调度控制系统的数据来自于10余套独立的应用系统,同样面临着数据量庞大、存在信息异构问题以及“数据共享不畅,数据集成程度不够”的挑战。
为了解决电力调度控制系统数据的信息异构和集成程度低问题,实现调控大数据共享和数据融合,需要研究基于大数据技术的多源异构数据融合技术。在异构数据融合过程中,涉及到了各种类型数据匹配问题。数字型、字符型的数据比较相对容易匹配,但是在匹配字符串类型数据时遇到了各种挑战——依据JaroDistance、Jaro-Winkler Distance和KMP等传统的字符串匹配算法匹配电力调控字符串数据时,会出现字符串数据匹配不上或者错误匹配等问题,严重影响了调控多源异构数据的融合过程,造成数据分析挖掘的结果的错误,干扰了电力系统调度计划的制定。
发明内容
本发明的目的在于提供一种电力调控系统多源异构数据融合中的字符串匹配方法用于解决电力调度控制系统多源异构数据融合中的字符串匹配问题。针对电力调度控制系统多源异构数据融合过程中存在的字符串匹配问题,为调控系统多源异构数据的融合提供了有力的技术支撑。可快速、准确的计算电力调度控制系统字符串数据匹配结果。
本发明首先依据电力调度控制系统数据特点制定了字符串匹配规则,其次给出了一种字符串匹配度计算方法,最后字符串匹配结果综合考虑匹配规则和匹配度得出。具体提出的字符串匹配方法如下:
根据电力调度控制系统数据特点,提取了调度控制系统数据关键词;
调控数据关键词是电力调控系统数据中专业的公共词语,根据电力调度控制系统数据信息和历史数据特点提取得到;
电力调控数据关键词包括变电站、变、站、电压、电压等级、kv、kv电压、交流、母线、线路、线、开关、刀闸、隔离开关、断路器、电抗器、电流互感器、电压互感器、电容器;
针对调度控制系统数据关键词中存在的多词同义问题,提出了一种关键词等价规则,将表示同种意思的关键词以等价关系进行处理;
数字类数据匹配规则为:
对于调控字符串数据中出现的阿拉伯数字、希腊字母等数字型数据,如果连续出现若干个阿拉伯数字,则将这若干个连续数字转换为数字型数据,并按照数字型数据匹配方法计算匹配结果;若匹配成功,则进行下一步匹配工作;若匹配失败,则判定整个字符串不匹配。同理,若出现希腊数字,则需要将连续的希腊数字单独取出,并判断希腊数字对应部分是否相等。若相等,则进行下一步匹配工作;若不相等,则判定整个字符串不匹配。
针对调控字符串数据中出现的连续若干个阿拉伯数字或者希腊数字是否匹配直接影响字符串匹配结果的问题,制定了数字类数据匹配规则,将若干个连续数字转换为数字型数据处理;
根据电力调度控制系统数据特点和字符串匹配规则,提出了一种字符串匹配度计算方法;
根据电力调度控制系统数据特点、字符串匹配度计算方法以及关键词、数字型数据匹配规则,制定了电力调度控制系统字符串数据匹配总规则。
优选的,上述电力调度控制系统多源异构数据的字符串匹配方法中,所述电力调度控制系统字符串数据匹配总规则包括:
关键词匹配规则、数字型数据匹配过程、计算字符串匹配度和字符串匹配结果判定规则。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华北电力大学,未经华北电力大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710079131.7/2.html,转载请声明来源钻瓜专利网。