[发明专利]一种食品安全知识图谱及相关智能问答系统的构建方法有效
申请号: | 201910981977.9 | 申请日: | 2019-10-16 |
公开(公告)号: | CN110781315B | 公开(公告)日: | 2022-11-08 |
发明(设计)人: | 秦丽;郝志刚;赵良;倪福川 | 申请(专利权)人: | 华中农业大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/34;G06F16/332;G06F40/295 |
代理公司: | 深圳紫晴专利代理事务所(普通合伙) 44646 | 代理人: | 雒盛林 |
地址: | 430070 湖北省*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 食品安全 知识 图谱 相关 智能 问答 系统 构建 方法 | ||
本发明公开了一种食品安全知识图谱及相关智能问答系统的构建方法,所述的食品安全知识图谱整理了大量近年来官方发布的不合格食品的数据,让人们可以方便查询到自己想要了解的相关食品信息,通过设计食品安全本体,可以解决知识图谱中相关知识融合与知识推理的问题,本体整理了与食品生产和食品检测相关的概念、分类与关系,帮助人们分析不合格食品出现的原因和分布,并通过设计HACCP体系的本体模型,为实现以HACCP为基础的食品安全溯源提供推理机制,帮助人们为未来可能出现的食品问题提供溯源与预警,所述的基于食品安全知识图谱的智能问答系统,通过搭建web网站方便用户在线访问,用自然语言访问知识图谱。
技术领域
本发明涉及计算机数据处理技术领域,具体是指一种食品安全知识图谱及相关安全问答系统的构建方 法。
背景技术
近年来食品安全问题一直是大众舆论关注的焦点,但是目前几乎没有办法能够帮助人们了解这些不合 格食品产生的原因以及未来可能出现的关于食品安全问题的溯源和预警。
知识图谱是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其 载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。通过将应用数学、图形学、信息可视 化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形 象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论,能够 为学科研究提供切实的、有价值的参考。所以可以将食品安全知识与知识图谱相结合来解决现在人们所遇 到的食品安全方面的问题。
发明内容
本发明的目的在于提供一种食品安全知识图谱及相关安全问答系统的构建方法以解决食品安全方面 的问题。
其采用技术方案如下,
一种食品安全知识图谱的构建方法为:
(1)采集数据集:使用Python脚本对网上的不合格食品信息进行爬取,根据《市场监管总局关于印 发2019年食品安全监督抽检计划的通知》上附带的食品安全抽检品种和项目表将不合格食品信息分为33 个大类,并将其进行初步过滤,得到初始文本数据集,再将初始文本数据集处理后导入postgrsql数据库 进行清洗,得到结构化文本库;
(2)实体抽取:实体抽取分为两个部分,一个是通用实体的抽取,采用命名实体识别技术,工具为斯 坦福的CoreNLP,另一个部分是领域实体的抽取,主要依据关键词匹配算法;
(3)关系抽取:首先对已经抽取的实体确定两种实体间的关系,一是公司-食品的生产关系,二是食 品-不合格项目的抽检关系,再确定实体所拥有的属性关系,一是食品与生产地,二是食品与生产时间;
(4)同义词库构建:建立同义词库对实体关系和属性进行识别;
(5)RDF三元组映射:将抽取到的实体与关系转化成RDF图模型,主要为借助D2Rq工具生成映射规则 并依据数据表的结构以及表间关系对其进行相应调整,可分为实体表的映射和实体表对关系表的映射;
(6)本体构建:为从网上爬取得来的数据建立食品安全本体;
(7)知识图谱存储与可视化:采用gStore对知识图谱进行存储,使用的查询语言是SPARQL,同时使 用d3js脚本程序对三元组文件进行图形化展示,每个节点代表一个实体,节点之间的连线代表实体之间 的关系。
作为进一步说明的,步骤(1)中初始文本数据集中共收集77560篇文本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中农业大学,未经华中农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910981977.9/2.html,转载请声明来源钻瓜专利网。