[发明专利]一种针对食品安全法规问答系统的知识图谱构建方法有效

专利信息
申请号: 201910898625.7 申请日: 2019-09-23
公开(公告)号: CN110674274B 公开(公告)日: 2022-07-01
发明(设计)人: 郑丽敏;乔振铎 申请(专利权)人: 中国农业大学
主分类号: G06F16/332 分类号: G06F16/332;G06F16/35;G06F16/36
代理公司: 暂无信息 代理人: 暂无信息
地址: 100083 北京市海淀*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 针对 食品安全 法规 问答 系统 知识 图谱 构建 方法
【权利要求书】:

1.一种针对食品安全法规问答系统的知识图谱构建方法,其特征在于,包括:

获取食品安全法规权威网站上人们提出的食品安全法规问题,并过滤通过判断问句的主题题目,从而将问题分为食品安全风险监测、食品安全标准、食品生产经营、食品检验、食品进出口、食品安全事故处置、监督管理、法律责任、食品安全法规一般知识共10大类;

根据得到的问题分类设定为一级分类结果,为了将问题分类到具体的实体,将一级分类结果进一步划分,得到二级、三级或是四级分类结果,直至得到不可再分实体,构建问题管理类知识图谱;

获取下载食品安全法规网站上我国目前现行有效的食品安全法规,并获取法规类别信息和法规章节内容信息作为法规知识图谱的管理类,即管理法规的本体类;

利用每部法规章节的条理性通过正则匹配得到每部法规的章、条、节名称;

利用分词工具以及TF-IDF方法,对法律法规正文语料进行预处理、分词、词性标注,并以词频统计主题词,再进行实体标注、实体关系抽取、属性抽取,构件法律法规知识图谱;

根据所述得到的问题管理类知识图谱中的实体与食品安全法规知识图谱中的实体通过实体相似度计算进行匹配,连接两类知识图谱;

获取的知识图谱的实体、实体关系及实体属性存储到Neo4j数据库中,实现可视化。

2.根据权利要求1所述的一种针对食品安全法规问答系统的知识图谱构建方法,其特征在于,获取得到分类结果,根据所述得到的问题分类结果,以其一级分类为基准划分领域,其余每一级分类具体实体名称统计起来作为该领域词典。

3.根据权利要求1所述的一种针对食品安全法规问答系统的知识图谱构建方法,其特征在于,利用TF-IDF统计方法提取出指定法规主题关键词,将文本转化为.csv格式,通过构建起词频矩阵,利用TF-IDF算法进行权值计算,对计算得到的权值进行排序,选出权值较大的作为关键词,其中TF-IDF算法,TF为词频,表示某一特定关键词K在文本中出现的频率,IDF为逆向文件频率,某一特定关键词K的IDF值可由语料库文件总数除以包含关键词K的文件数并取对数得到; 具体计算公式如下:

TF-IDF=TF×IDF

公式中m——关键词K在文件中出现的次数;

n——文件中包含关键词的总数;

u——语料库文件总数;

v——包含关键词K的文件数。

4.根据权利要求1所述的一种针对食品安全法规问答系统的知识图谱构建方法,其特征在于,利用法规文档自身特点通过正则表达式匹配,其描述了一种字符串匹配模式,可以用来检查一个字符串中是否含有某种子串,匹配出的法规章节名称作为食品安全法规领域词典。

5.根据权利要求1所述的一种针对食品安全法规问答系统的知识图谱构建方法,其特征在于,基于依存关系模型的实体抽取与关系抽取,根据得到已经词性标注过的法规文档,抽取不同实体之间的依存关系路径,同时抽取出实体与关系。

6.根据权利要求1所述的一种针对食品安全法规问答系统的知识图谱构建方法,其特征在于,将所述问题管理类知识图谱中的实体与法规知识图谱中的实体进行实体相似度计算,利用层次聚类方法中Singe Linkage算法来计算实体相似度,Singe Linkage算法是输入要计算的N个实体对象以及N*N的距离矩阵,每个类仅包含一个对象,类与类之间的距离就是他们所包含的对象之间的距离,然后通过计算将每个类之间的距离,对计算出的距离值进行排序,将距离最近的两个类合并,也就是将相似的两个实体合并。

7.根据权利要求1所述的一种针对食品安全法规问答系统的知识图谱构建方法,其特征在于,利用可视化工具将构建的知识图谱进行展示,所述可视化工具包括Neo4j图形数据库。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国农业大学,未经中国农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910898625.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top