[发明专利]一种变电站工程选址知识图谱构建方法在审
申请号: | 202210277367.2 | 申请日: | 2022-03-15 |
公开(公告)号: | CN114817556A | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 王立;刘志宏;颜霞;李振;陈飞;汪黔疆;张方银;杨钦 | 申请(专利权)人: | 贵州电网有限责任公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/387;G06Q50/06 |
代理公司: | 南京禹为知识产权代理事务所(特殊普通合伙) 32272 | 代理人: | 张永强 |
地址: | 550002 贵*** | 国省代码: | 贵州;52 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 变电站 工程 选址 知识 图谱 构建 方法 | ||
1.一种变电站工程选址知识图谱构建方法,其特征在于:包括以下步骤,
采集变电站工程选址的相关规范和标准,经术语抽取得到变电站工程选址知识图谱的关键术语;
参照现有选址的相关规范和标准,结合关键术语,经筛选,得到变电站工程选址的概念集合和关系集合;
根据概念集合和关系集合建立“概念-关系-概念”三元组,构建本体层知识图谱;
采集现有变电站的运行资料,经知识抽取和筛选处理后得到变电站工程选址知识的实体集合、关系集合以及属性集合;
通过实体集合、关系集合以及属性集合建立“实例-关系-实例”和“实例-关系-属性”三元组,构建实例层知识图谱;
基于本体层知识图谱和实例层知识图谱以及相互之间的映射关系,构建用于变电站工程选址的知识体系。
2.根据权利要求1所述的变电站工程选址知识图谱构建方法,其特征在于:所述采集变电站工程选址的相关规范和标准,经术语抽取得到变电站工程选址知识图谱的关键术语,包括以下步骤:
术语抽取,首先使用阈值分类器抽取出语料库中的双字候选词汇,然后再对候选词汇向左右两侧进行一定程度的扩充,筛选符合要求的多字候选词汇;
使用TF-IDF算法对所得候选词汇进行过滤以得到最终结果,即变电站工程选址知识图谱的关键术语。
3.根据权利要求2所述的变电站工程选址知识图谱构建方法,其特征在于:所述使用TF-IDF算法对所得候选词汇进行过滤以得到变电站工程选址知识图谱的关键术语,包括以下步骤:
首先,计算词频tfij,即:
其中,ni,j是该词语在文件dj中出现的次数,nk,j分母则是文件dj中所有词汇出现的次数总和;
然后,计算逆向文件频率IDF,即:
其中,|D|是收集的变电站工程选址知识中的文件总数,|{j:ti∈dj}|表示包含该词语的文件总数(即ni,j≠0的文件总数);
最后,计算TF-IDF,即:TF-IDF=TF×IDF
其中,TF(tfij)表示为词频,IDF表示为逆向文件频率。
4.根据权利要求2或3所述的变电站工程选址知识图谱构建方法,其特征在于:参照现有选址的相关规范和标准,结合关键术语,经筛选,得到变电站工程选址的概念集合和关系集合,包括以下步骤:
根据关键术语和采集的变电站选址相关规范和标准,经过筛选得到变电站工程选址知识图谱本体层概念集合;
根据获取的概念集合,使用远程监督算法对采集的变电站工程选址相关规范、标准进行关系抽取,再经过筛选得到变电站工程选址知识图谱本体层关系集合。
5.根据权利要求4所述的变电站工程选址知识图谱构建方法,其特征在于:在得到变电站工程选址知识图谱本体层关系集合的过程中,还包括以下步骤:
根据得到的概念集合再结合知识库进行概念对比,对采集的变电站选址相关规范、标准等资料进行关系标注;
根据获取的知识进行远程监督关系抽取模型训练,利用得到的模型进行关系抽取,得到变电站工程选址知识图谱本体层关系集合。
6.根据权利要求1~3和5任一所述的变电站工程选址知识图谱构建方法,其特征在于:对知识图谱本体层概念集合和关系集合进行检查和评估,包括两方面:一是核心概念结构的合理性,二是每个概念的合理性、必要性以及相似概念间的辨析。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贵州电网有限责任公司,未经贵州电网有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210277367.2/1.html,转载请声明来源钻瓜专利网。