[发明专利]一种面向专业领域的知识本体的构建方法及系统在审
申请号: | 202110081601.X | 申请日: | 2021-01-21 |
公开(公告)号: | CN112800238A | 公开(公告)日: | 2021-05-14 |
发明(设计)人: | 张博文;高飞;杨宁;贾鹏飞;韩帅;杨洋;李丽华;胡成博;刘子全 | 申请(专利权)人: | 中国电力科学研究院有限公司;国网江苏省电力有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06F40/237;G06N5/02;G06Q50/06 |
代理公司: | 北京工信联合知识产权代理有限公司 11266 | 代理人: | 夏德政 |
地址: | 100192 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 专业 领域 知识 本体 构建 方法 系统 | ||
1.一种面向专业领域的知识本体的构建方法,其特征在于,包括:
确定知识本体的专业领域;
建立领域知识体系,根据所述领域知识体系收集与所述专业领域相关的文本资料,并且根据知识本体的应用场景以及知识本体的结构密度,确定知识本体的构建原则;
根据所述知识本体的构建原则,抽取领域知识资料中的概念属性,确定所述文本资料中的术语;
对所述术语进行分类,确定所述术语的类以及类的等级体系,并且根据所述术语的类,确定所述类的属性以及属性的分面;
基于所述类的属性以及属性的分面,构建面向所述专业领域的知识本体。
2.根据权利要求1所述的方法,其特征在于,建立领域知识体系,根据所述领域知识体系收集与所述专业领域相关的文本资料,包括:
根据文本资料的数据类型,将所述文本资料分为结构化文本资料以及非结构化文本资料。
3.根据权利要求1所述的方法,其特征在于,根据知识本体的应用场景以及知识本体的结构密度,确定知识本体的构建原则,包括:
根据知识本体的应用场景以及知识本体的结构密度,确定知识本体的层级深度以及概念的颗粒度;
根据术语在所述应用场景中的复杂度,判定所述术语为概念还是属性,并确定判定结果;
根据所述知识本体的层级深度、概念的颗粒度以及所述判定结果,确定知识本体的构建原则。
4.根据权利要求2所述的方法,其特征在于,根据所述知识本体的构建原则,抽取领域知识资料中的概念属性,确定所述文本资料中的术语,包括:
对所述结构化文本资料进行词性标注;
对所述非结构化文本资料进行分词并进行词性标注;
筛选出所述文本资料中的名词、动词、形容词以及短语。
5.根据权利要求1所述的方法,其特征在于,对所述术语进行分类,确定所述术语的类以及类的等级体系,包括:
根据自顶向下法以及自底向上法,确定术语中的重要术语和中级术语;
将所述重要术语进行归纳和演绎,并将所述重要术语与所述中级术语关联。
6.根据权利要求4所述的方法,其特征在于,根据所述术语的类,确定所述类的属性以及属性的分面,包括:
将所述概念关联到与所述概念相对应的属性;
根据所述术语的类,确定所述类的属性的基数约束以及所述类的属性的类型。
7.根据权利要求6所述的方法,其特征在于,还包括:
基于碰撞树调试算法对构建的知识本体进行评估。
8.一种面向专业领域的知识本体的构建系统,其特征在于,包括:
确定专业领域模块,用于确定知识本体的专业领域;
确定构建原则模块,用于建立领域知识体系,根据所述领域知识体系收集与所述专业领域相关的文本资料,并且根据知识本体的应用场景以及知识本体的结构密度,确定知识本体的构建原则;
确定术语模块,用于根据所述知识本体的构建原则,抽取领域知识资料中的概念属性,确定所述文本资料中的术语;
确定属性及分面模块,用于对所述术语进行分类,确定所述术语的类以及类的等级体系,并且根据所述术语的类,确定所述类的属性以及属性的分面;构建知识本体模块,用于基于所述类的属性以及属性的分面,构建面向所述专业领域的知识本体。
9.根据权利要求8所述的系统,其特征在于,确定构建原则模块,包括:
划分子模块,用于根据文本资料的数据类型,将所述文本资料分为结构化文本资料以及非结构化文本资料。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电力科学研究院有限公司;国网江苏省电力有限公司,未经中国电力科学研究院有限公司;国网江苏省电力有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110081601.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种防暴水炮车混合注入优化系统
- 下一篇:一种冷却输送装置