[发明专利]知识图谱的生成方法及装置有效
申请号: | 201910365180.6 | 申请日: | 2019-04-30 |
公开(公告)号: | CN110096599B | 公开(公告)日: | 2023-03-21 |
发明(设计)人: | 李昀 | 申请(专利权)人: | 长沙知了信息科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36 |
代理公司: | 北京知果之信知识产权代理有限公司 11541 | 代理人: | 唐海力;李志刚 |
地址: | 410000 湖南省长*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 知识 图谱 生成 方法 装置 | ||
1.一种知识图谱的生成方法,其特征在于,包括:
获取文本数据;
将所述文本数据中的计算机语言源码符合文法符号的识别为实体,得到实体集;
分析所述计算机语言源码,并确定所述实体集中的实体间的指向关系;以及,
根据所述实体集和所述指向关系生成知识图谱;
获取文本数据之后还包括:采用依赖树和词性标注对所述文本数据的语料文本进行从上至下迭代分析,得到语法关系三元组;通过主题建模对语法关系三元组做实体检测;将检测到的实体加入所述实体集;
获取文本数据之后还包括:对所述文本数据的语料文本依次进行消除噪音、词汇规范化、对象标准化的处理;采用依赖树和词性标注对处理后的所述文本数据进行从上至下迭代分析,得到语法关系三元组;通过主题建模对语法关系三元组做实体检测;将检测到的实体加入所述实体集;
获取文本数据之后还包括:提取所述文本数据的语言文本的语法规范中的语言符号;将所述语言符号加入所述实体集;
将检测到的实体加入所述实体集之后还包括:按照术语频率-逆文献频率的权重,给做实体检测得到的实体赋予权重值;比对权重值;根据比对结果确定一对一或一会多的实体间的指向关系;
将所述语言符号加入所述实体集之后还包括:提取所述语法规范中实体的概念和术语;判断概念和术语是否存在于实体集的实体中;如果存在,则建立语法规范中实体和实体集中实体的指向关系;如果不存在,将语法规范中实体加入实体集。
2.根据权利要求1所述的知识图谱的生成方法,其特征在于,将所述文本数据中的计算机语言源码符合文法符号的识别为实体,得到实体集包括:
识别所述文本数据中的计算机语言源码中的标识符是否符合符号表中规定的文法符号;
如果是,则将所述标识符识别为实体;
将识别为实体的标识符加入实体集。
3.根据权利要求1所述的知识图谱的生成方法,其特征在于,分析所述计算机语言源码,并确定所述实体集中的实体间的指向关系包括:
对所述计算机语言源码按照预设顺序规则依次进行词法、语法、语义分析,得到抽象语法树;
根据抽象语法树确定实体集中实体间的指向关系。
4.一种知识图谱的生成装置,其特征在于,包括:
获取单元,用于获取文本数据;
识别单元,用于将所述文本数据中的计算机语言源码符合文法符号的识别为实体,得到实体集;
确定单元,用于分析所述计算机语言源码,并确定所述实体集中的实体间的指向关系;
生成单元,用于根据所述实体集和所述指向关系生成知识图谱;获取文本数据之后还包括:采用依赖树和词性标注对所述文本数据的语料文本进行从上至下迭代分析,得到语法关系三元组;通过主题建模对语法关系三元组做实体检测;将检测到的实体加入所述实体集;
获取文本数据之后还包括:对所述文本数据的语料文本依次进行消除噪音、词汇规范化、对象标准化的处理;采用依赖树和词性标注对处理后的所述文本数据进行从上至下迭代分析,得到语法关系三元组;通过主题建模对语法关系三元组做实体检测;将检测到的实体加入所述实体集;
获取文本数据之后还包括:提取所述文本数据的语言文本的语法规范中的语言符号;将所述语言符号加入所述实体集;
将检测到的实体加入所述实体集之后还包括:按照术语频率-逆文献频率的权重,给做实体检测得到的实体赋予权重值;比对权重值;根据比对结果确定一对一或一会多的实体间的指向关系;
将所述语言符号加入所述实体集之后还包括:提取所述语法规范中实体的概念和术语;判断概念和术语是否存在于实体集的实体中;如果存在,则建立语法规范中实体和实体集中实体的指向关系;如果不存在,将语法规范中实体加入实体集。
5.根据权利要求4所述的知识图谱的生成装置,其特征在于,所述确定单元包括:
分析模块,用于对所述计算机语言源码按照预设顺序规则依次进行词法、语法、语义分析,得到抽象语法树;
确定模块,用于根据抽象语法树确定实体集中实体间的指向关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长沙知了信息科技有限公司,未经长沙知了信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910365180.6/1.html,转载请声明来源钻瓜专利网。