[发明专利]一种能力知识抽取及能力知识图谱构建的方法有效
申请号: | 201811095330.8 | 申请日: | 2018-09-19 |
公开(公告)号: | CN109189943B | 公开(公告)日: | 2021-06-04 |
发明(设计)人: | 郭橙;康子路;龚军;熊梓策;刘佩云 | 申请(专利权)人: | 中国电子科技集团公司信息科学研究院 |
主分类号: | G06F16/36 | 分类号: | G06F16/36 |
代理公司: | 北京辰权知识产权代理有限公司 11619 | 代理人: | 刘广达 |
地址: | 100000 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 能力 知识 抽取 图谱 构建 方法 | ||
1.一种能力知识抽取方法,其特征在于,包括:
数据采集,从网络以及被网络连接的物体中获取文本数据;
数据识别,采用自然语言处理方法对所述文本数据进行处理;
数据理解,根据具体规则对经过自然语言处理的文本数据进行标签标记;
数据筛选,通过多种模型对标签后的数据进行能力知识的提取和筛选;
在所述数据筛选中,所述多种模型包括:空间模型,用于对输入数据中的能力知识进行提取和筛选,并保留筛选后数据的空间结构特征;时序模型,用于对输入数据中的能力知识进行提取,并完成对输入数据的时序分析;
数据归纳,对筛选后数据中的标签进行识别、归纳,进而获取能力知识;
在所述数据归纳中,所述对筛选后数据中的标签进行识别、归纳,进而获取能力知识包括:以概率图模型作为标签识别规则的载体,通过条件随机场的判别实现对筛选后数据中的标签的识别;通过维特比算法,对条件随机场判别结果进行组合优化,选出标签的最优规划路径,从而获得具体的能力知识。
2.根据权利要求1所述的能力知识抽取方法,其特征在于,在所述数据识别的过程中采用到的自然语言处理方法包括:
提取所述文本数据中的字向量或词向量;以及,
对所述文本数据进行词性标注,进而根据所述词性标注进行分词。
3.根据权利要求1所述的能力知识抽取方法,其特征在于,所述数据理解中所述具体规则为,根据所述自然语言处理的结果以及所述数据筛选过程中的多种模型经训练获得。
4.根据权利要求1所述的能力知识抽取方法,其特征在于,所述空间模型采用了卷积模型,其具体包括卷积过程和池化过程;
其中,卷积过程用于能力知识的提取,池化过程用于能力知识的筛选。
5.根据权利要求4所述的能力知识抽取方法,其特征在于,所述卷积模型中包含一次或多次卷积过程和池化过程。
6.根据权利要求1所述的能力知识抽取方法,其特征在于,所述时序模型采用了递归神经网络,和长短记忆模型,用于进行时序分析,和解决时序分析过程中随着文本长度增加而导致文本信息梯度消失的问题。
7.根据权利要求6所述的能力知识抽取方法,其特征在于,所述递归神经网络以卷积模型的输出作为输入,从而同时保留了能力知识的空间结构和时序特征。
8.根据权利要求1所述的能力知识抽取方法,其特征在于,在所述数据识别前还包括:表格数据的整理、标点符号的识别以及无用字符的筛除。
9.一种能力知识图谱的构建方法,其特征在于,包括:
根据权利要求1-8中任一项所述的能力知识抽取方法,获得能力本体;
采用机器学习方法对能力本体的抽取过程进行学习;
将知识本体分类存储,进而获得能力知识图谱。
10.根据权利要求9所述的能力知识图谱的构建方法,其特征在于,所述能力本体包括:能力实体以及命名实体,其中,所述命名实体为现实中对物体的具体抽象概念;所述能力实体为对应所述抽象概念的能力或性质。
11.根据权利要求10所述的能力知识图谱的构建方法,其特征在于,所述能力或性质用于建立物体间的联系。
12.根据权利要求9所述的能力知识图谱的构建方法,其特征在于,所述能力知识图谱具体为能力本体的集合,所述能力本体为具有结构化语义的能力知识。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司信息科学研究院,未经中国电子科技集团公司信息科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811095330.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种充气纽扣及其充气方法
- 下一篇:一种LED吊顶灯