[发明专利]电网调度结构化数据的检索方法及装置在审
申请号: | 201610011518.4 | 申请日: | 2016-01-08 |
公开(公告)号: | CN105677864A | 公开(公告)日: | 2016-06-15 |
发明(设计)人: | 阎博;杨笑宇;郭子明;刘慧勇;张昊;白静洁;王东升;刘涛;武江;喻宏元;徐家慧;张晓 | 申请(专利权)人: | 国网冀北电力有限公司;国家电网公司;北京科东电力控制系统有限责任公司;华中电网有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q50/06 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 王涛 |
地址: | 100053 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电网 调度 结构 数据 检索 方法 装置 | ||
技术领域
本发明涉及电网调度自动化技术领域,尤其涉及一种电网调度结构化数据的检索 方法及装置。
背景技术
随着电力工业的不断发展,电网机构每日处理的管理信息快速增长。一方面,是 由于电网结构日趋复杂,接入设备无论数量还是类型均明显增加;另一方面,是因为 供电质量标准不断提高,要求电网机构对各类生产信息和管理信息处理的及时性增 强。
在电力调度控制领域,随着冀北省地两级分布式调度管理系统建设的逐步深入, 调度管理工作的信息化程度不断提高。调度管理系统包含的业务越来越丰富,业务关 系也逐步清晰,逐步形成了模块清晰、结构庞大的调度管理类应用框架。随着系统的 复杂度不断提高,业务数据的数据量也日渐丰富,系统汇集了海量的调度运行和管理 数据。海量的数据里蕴含了丰富的电力调度业务的价值,同时也存在着如何开发和利 用这些数据的问题,搜索引擎面对这种需求应运而生,搜索引擎能够根据一定的策略 和算法,快速的收集和检索信息,为用户提供检索服务,将用户检索相关的信息展示 给用户。
从数据存储格式上来说,当前调度运行和管理数据有两种存储格式:结构化数据 和非结构化数据。针对非结构化数据的检索,主要对非结构化的文件进行解析和分析, 建立索引文件,然后根据搜索词与文件的匹配度实现检索功能和排序功能。但是,针 对结构化数据的检索就无法满足了,通用的检索方法只是将模糊的搜索结果返回给用 户,而用户对结构化数据的检索需求通常很明确或者具有唯一性,例如查询滦河电厂 的今日电量,用户需要的返回结果应该是某个表里的一条数据,而不是一大堆名称匹 配但是无关的数据。
导致检索结果不准确,检索效率低的原因如下:电网调度领域积累了大量数据, 数据来源多种多样、数据关系复杂,人工梳理数据之间的关系非常困难,无法梳理清 楚数据之间的关系就很难提高搜索的全面性和准确性。电网调度领域的数据来源多种 多样,比如文件服务器、各类应用服务器、数据库服务器等。同时,数据种类复杂, 包括了结构化、非结构化、半结构化等各种类型的数据。面对这些来源复杂、种类繁 多的海量数据,需要解决海量数据存储问题。针对海量的存储数据,电网调度领域传 统的技术难以实现数据的快速检索。
针对上述问题,目前尚未提出有效的解决方案。
发明内容
本发明提供了一种电网调度结构化数据的检索方法及装置,以至少解决现有的电 网调度结构化数据的检索结果与用户需求匹配度不高,检索效率低的问题。
根据本发明的一个方面,提供了一种电网调度结构化数据的检索方法,包括:接 收用户输入的查询词;在预先构建的语义表达式模板中匹配所述查询词对应的语义表 达式;对匹配的语义表达式进行解析,结合所述查询词得到查询表达式;根据所述查 询表达式中的查询条件,在预先构建的结构化数据索引文件中进行检索,得到检索结 果,其中,所述结构化数据索引文件是基于结构化数据与预先构建的电网调度领域知 识库的关系构建的,所述电网调度领域知识库包括:关键词、关键词所属的类别、类 别对应的一个或多个特征、类别之间的关系;所述检索结果包括与所述查询词关联的 数据;按照预设排序指标对所述检索结果进行排序;输出排序后的检索结果。
在一个实施例中,在接收用户输入的查询词之前,所述方法还包括:构建所述电 网调度领域知识库;从数据库中获取结构化数据,基于所述电网调度领域知识库,建 立各个类别与结构化数据之间的关系,得到多个数据表;利用倒排索引技术基于各个 关键词与结构化数据之间的关系构建所述结构化数据索引文件;为每个数据表构建语 义表达式模板。
在一个实施例中,为每个数据表构建语义表达式模板,包括:针对每个数据表, 根据该数据表对应的查询条件以及返回结果建立语义表达式模板,其中所述语义表达 式模板包括:该数据表用到的所有查询条件的组合以及所有返回结果的组合。
在一个实施例中,在预先构建的语义表达式模板中匹配所述查询词对应的语义表 达式,包括:将所述查询词拆分成一个或多个词汇;根据所述电网调度领域知识库, 在所述一个或多个词汇中选取电力词汇,删除无用的词汇;在所述预先构建的语义表 达式模板中,匹配所述电力词汇对应的语义表达式;对匹配的语义表达式进行解析, 结合所述查询词得到查询表达式,包括:对匹配的语义表达式进行解析,结合所述电 力词汇得到所述查询表达式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网冀北电力有限公司;国家电网公司;北京科东电力控制系统有限责任公司;华中电网有限公司,未经国网冀北电力有限公司;国家电网公司;北京科东电力控制系统有限责任公司;华中电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610011518.4/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置