[发明专利]农业知识图谱构建装置、方法及计算机可读存储介质有效
申请号: | 201910528268.5 | 申请日: | 2019-06-18 |
公开(公告)号: | CN110209839B | 公开(公告)日: | 2021-07-27 |
发明(设计)人: | 吴良顺 | 申请(专利权)人: | 卓尔智联(武汉)研究院有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/295;G06F40/30;G06F40/253;G06F40/211;G06F16/951 |
代理公司: | 深圳市赛恩倍吉知识产权代理有限公司 44334 | 代理人: | 饶智彬;李艳霞 |
地址: | 430000 湖北省武汉市黄陂区盘龙城经*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 农业知识 图谱 构建 装置 方法 计算机 可读 存储 介质 | ||
1.一种农业知识图谱构建方法,其特征在于,所述方法包括:
获取一目标区域的农业领域数据,并基于获取的农业领域数据构建语料库;
对所述语料库中的语料进行分词与词性标注处理,以识别出多个实体概念;
根据预设筛选规则对识别出的实体概念进行筛选得到多个农业实体;
对所述语料库中的语料进行解析与关系提取,得到多个所述农业实体之间的关联关系;
根据每一所述农业实体以及每一所述农业实体之间的关联关系,建立农业知识图谱;
从网络上获取每一所述农业实体的百科信息;
基于预设提取规则对获取到的百科页面内容进行提取,并将提取得到的内容添加至所述语料库和/或所述农业知识图谱;
对获取到的百科页面内容进行相似度分析,得到每一所述农业实体的分类信息;及
将每一所述农业实体的分类信息添加至所述农业知识图谱;
其中,所述对获取到的百科页面内容进行相似度分析的步骤包括:
提取每一所述百科页面内容中的多个指定特征;
利用KNN算法计算得到任意两个百科页面内容之间的每一特征组的相似度;及
对计算得到的多个特征组的相似度进行加权运算得到所述任意两个百科页面内容的综合相似度。
2.如权利要求1所述的方法,其特征在于,所述农业领域数据包括非结构化的农业领域数据及半结构化的农业领域数据。
3.如权利要求1或2所述的方法,其特征在于,所述对所述语料库中的语料进行分词与词性标注处理,以识别出多个实体概念的步骤包括:
利用预设词法分析工具对所述语料库中的语料进行分词与词性标注处理;及
对词性标注的结果进行命名实体识别,以识别出多个实体概念。
4.如权利要求1所述的方法,其特征在于,所述对所述语料库中的语料进行解析与关系提取,得到多个所述农业实体之间的关联关系的步骤包括:
对所述语料库中的语料进行解析得到词法信息、句法信息及语义信息;及
将所述解析得到的词法信息、句法信息及语义信息输入至预先训练的关系提取模型,得到多个所述农业实体之间的关联关系。
5.如权利要求1所述的方法,其特征在于,所述根据每一所述农业实体以及每一所述农业实体之间的关联关系,建立农业知识图谱的步骤包括:
将每一所述农业实体的名称标识以及每一所述农业实体之间的关联关系导入至预设图形数据库,并进行可视化转换得到所述农业知识图谱。
6.一种农业知识图谱构建装置,所述装置包括处理器及存储器,所述存储器上存储有若干计算机程序,其特征在于,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1-5任一项所述的农业知识图谱构建方法的步骤。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有多条指令,多条所述指令可被一个或者多个处理器执行,以实现如权利要求1-5任一项所述的农业知识图谱构建方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于卓尔智联(武汉)研究院有限公司,未经卓尔智联(武汉)研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910528268.5/1.html,转载请声明来源钻瓜专利网。