[发明专利]一种食品安全知识图谱及相关智能问答系统的构建方法有效
申请号: | 201910981977.9 | 申请日: | 2019-10-16 |
公开(公告)号: | CN110781315B | 公开(公告)日: | 2022-11-08 |
发明(设计)人: | 秦丽;郝志刚;赵良;倪福川 | 申请(专利权)人: | 华中农业大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/34;G06F16/332;G06F40/295 |
代理公司: | 深圳紫晴专利代理事务所(普通合伙) 44646 | 代理人: | 雒盛林 |
地址: | 430070 湖北省*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种食品安全知识图谱及相关智能问答系统的构建方法,所述的食品安全知识图谱整理了大量近年来官方发布的不合格食品的数据,让人们可以方便查询到自己想要了解的相关食品信息,通过设计食品安全本体,可以解决知识图谱中相关知识融合与知识推理的问题,本体整理了与食品生产和食品检测相关的概念、分类与关系,帮助人们分析不合格食品出现的原因和分布,并通过设计HACCP体系的本体模型,为实现以HACCP为基础的食品安全溯源提供推理机制,帮助人们为未来可能出现的食品问题提供溯源与预警,所述的基于食品安全知识图谱的智能问答系统,通过搭建web网站方便用户在线访问,用自然语言访问知识图谱。 | ||
搜索关键词: | 一种 食品安全 知识 图谱 相关 智能 问答 系统 构建 方法 | ||
【主权项】:
1.一种食品安全知识图谱的构建方法,其特征在于,(1)采集数据集:使用Python脚本对网上的不合格食品信息进行爬取,根据《市场监管总局关于印发2019年食品安全监督抽检计划的通知》上附带的食品安全抽检品种和项目表将不合格食品信息分为33个大类,并将其进行初步过滤,得到初始文本数据集,再将初始文本数据集处理后导入postgrsql数据库进行清洗,得到结构化文本库;/n(2)实体抽取:实体抽取分为两个部分,一个是通用实体的抽取,采用命名实体识别技术,工具为斯坦福的CoreNLP,另一个部分是领域实体的抽取,主要依据关键词匹配算法;/n(3)关系抽取:首先对已经抽取的实体确定两种实体间的关系,一是公司-食品的生产关系,二是食品-不合格项目的抽检关系,再确定实体所拥有的属性关系,一是食品与生产地,二是食品与生产时间;/n(4)同义词库构建:建立同义词库对实体关系和属性进行识别;/n(5)RDF三元组映射:将抽取到的实体与关系转化成RDF图模型,主要为借助D2Rq工具生成映射规则并依据数据表的结构以及表间关系对其进行相应调整,可分为实体表的映射和实体表对关系表的映射;/n(6)本体构建:为从网上爬取得来的数据建立食品安全本体;/n(7)知识图谱存储与可视化:采用gStore对知识图谱进行存储,使用的查询语言是SPARQL,同时使用d3js脚本程序对三元组文件进行图形化展示,每个节点代表一个实体,节点之间的连线代表实体之间的关系。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中农业大学,未经华中农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910981977.9/,转载请声明来源钻瓜专利网。