[发明专利]面向电力生产管理系统关系数据库的关键词搜索方法有效
申请号: | 201210291274.1 | 申请日: | 2012-08-15 |
公开(公告)号: | CN102819600A | 公开(公告)日: | 2012-12-12 |
发明(设计)人: | 丁杰;胡斌;朱力鹏;杨佩;汪超 | 申请(专利权)人: | 中国电力科学研究院;国家电网公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q10/06;G06Q50/06 |
代理公司: | 北京安博达知识产权代理有限公司 11271 | 代理人: | 徐国文 |
地址: | 100192 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 电力 生产管理 系统 关系 数据库 关键词 搜索 方法 | ||
技术领域
本发明属于电力信息技术领域,具体涉及面向电力生产管理系统关系数据库的关键词搜索方法。
背景技术
基于关键词的搜索引擎是目前信息检索的主要方式,现有的互联网搜索引擎主要针对静态网页进行索引,而企业级搜索引擎则更多地关注于文档、视频、图像等非结构化数据的检索。对于电力应用而言,往往同时需要结构化数据和非结构化文本,两类信息的融合成为一个核心问题。目前两类信息的检索分别使用关系数据库和关键词查询技术实现,尚无有机集成。解决这一问题的关键在于寻求高效的信息查询方法,从而实现对两类信息的自由查询。鉴于关键词查询在非结构化数据检索中的易用性,目前的热点在于将关键词查询技术应用到关系数据库领域。在电力行业的实际应用中,大量数据保存在后台关系型数据库,需要特定的查询接口,同时数据查询要求操作人员具有专业的背景知识来分析数据间的关联关系。针对这一问题,现有的网络搜索引擎无法提供电力结构化数据的检索,需要研究基于关键词的数据库搜索技术。
目前数据库搜索技术研究主要包括三个方面:
1)基础理论和算法的研究,涉及关系库建模、系统体系结构设计和搜索排序算法分析;
2)搜索准确性研究,涉及搜索性能、搜索结果显示等重要环节的优化;
3)传统搜索引擎扩展,涉及面向用户的语义搜索分析,以及研究如何将数据库搜索技术向分布式环境迁移。
目前数据库搜索技术主要存在如下需要解决的问题:
1)在实时性要求较高的场合,搜索引擎需要从数据库模式中分析用户输入的关键字与数据库查询语言间的关系,并提供在线的数据查询,但数据库模式的复杂性导致查询效率低下;
2)在实时性要求较低的场合,现有的解决方案通过数据采集将数据库中的记录进行组织和本地存储,但数据记录的规模的急剧膨胀导致数据的存储和分析效率不高;
3)现有的搜索结果排序一般使用IR索引或继承传统搜索引擎的PageRank算法,但这类排序机制是否适用于数据库搜索的场合尚无定论。
发明内容
为了克服上述现有技术的不足,本发明提供一种面向电力生产管理系统关系数据库的关键词搜索方法,该方法能够有效关联业务数据库的不同关系表,结合业务知识和流程规范实现全局化的数据查询,降低业务数据查询的复杂性,使得用户可以快速、方便地获取所需的搜索结果。
为了实现上述发明目的,本发明采取如下技术方案:
一种面向电力生产管理系统关系数据库的关键词搜索方法,所述方法包括以下步骤:
步骤1:根据关键词定位关系表;
步骤2:依据业务词典规约查询过程;
步骤3:以关键词为中心查询数据;
步骤4:依据业务规则扩展查询模式;
步骤5:返回查询结果。
所述步骤1中,用户通过查询节点索引表,在数据库模式图中找到至少包含一个搜索关键词的节点,其中数据库模式图是无向图G=(V,E),V为顶点的集合,每个顶点对应于一个关系表,E为边的集合,每条边对应于一个外键关系。
所述节点索引表创建过程为:将数据表关系表中的每列的各个字段拼接成文档,对该文档抽取关键词,形成关键词到表名、列名的倒排索引。
所述步骤2中,筛选所述关键词对应的节点,若关键词不存在于节点对应的业务词典,则去除该节点。
所述业务词典的创建过程为:选取关系表中的关键属性,将表格中所有关键属性列拼接成文档,对该文档抽取关键词,形成该关系表对应的业务词典。
所述步骤3中,以生成的节点为中心进行扩展,生成候选的数据查询模式,每个查询模式是数据库模式图的子图,且包含了所有的关键词。
根据权利要求6所述的面向电力生产管理系统关系数据库的关键词搜索方法,其特征在于:采用宽度遍历方法生成所述数据查询模式,过程如下:
1)定义队列Q、V,将所有产生的中心节点作为初始模式添加到队列Q和V;
2)从Q中取出模式P,将P的关联模式{P1,P2,…,Pn}添加到队列Q和V,其中关联模式Pi(i=1,2,…,n)满足如下条件:
a)|Pi|=|P|+1,|Pi|为Pi中包含节点的个数;
b)Pi为连通图且不存在于V;
3)依次遍历Q中所有的模式,直到Q为空,选取符合如下条件的查询模式作为输出结果:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电力科学研究院;国家电网公司,未经中国电力科学研究院;国家电网公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210291274.1/2.html,转载请声明来源钻瓜专利网。