[发明专利]一种食品安全标准关联知识图谱构建方法及系统在审
申请号: | 202211087778.1 | 申请日: | 2022-09-07 |
公开(公告)号: | CN115658911A | 公开(公告)日: | 2023-01-31 |
发明(设计)人: | 段敏;刘鹏;刘文;戴岳;刘朴真;黄蓉 | 申请(专利权)人: | 中国标准化研究院 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06N5/02;G06F16/901;G06F40/289;G06F40/216;G06F16/33 |
代理公司: | 北京睿智保诚专利代理事务所(普通合伙) 11732 | 代理人: | 韩迎之 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 食品 安全标准 关联 知识 图谱 构建 方法 系统 | ||
本发明公开了一种食品安全标准关联知识图谱构建方法及系统,涉及食品安全技术领域,首先获取食品安全标准数据源;对食品安全标准数据源中的结构化数据和非结构化数据进行语义识别,得到知识数据集;对每条知识进行分词处理;基于TF‑IDF算法,计算每条知识中每个分词所占权重;将每条知识中每个分析的权重和预设阈值进行比较,将符合阈值条件的分词作为该条知识的标签;依据标签所代表的实体之间的关系,构建食品安全标准关联知识图谱。本发明能够提高食品安全标准关联知识图谱构建过程的工作效率,同时还能够提高每条知识所带标签的科学性和准确性。
技术领域
本发明涉及食品安全技术领域,更具体的说是涉及一种食品安全标准关联知识图谱构建方法及系统。
背景技术
食品安全领域的数据量庞大,有海量的相关法律法规、国家标准、地方标准等,知识图谱的兴起对数据的存储方式产生了极大地改变,真实世界的数据也往往以知识图谱的形式进行展现,知识图谱可以更加丰富的展现重大活动食品安全数据信息,现有技术中通常是将所有的法律法规、国家标准、地方标准的知识都关联起来,形成食品安全知识图谱,以表示食品生产过程中各类因果关联。对于食品从业者来说,可以代替很大一部分专家,减少花费;对于消费者来说,可以查询产品的安全性,便于分辨变质食品。
在知识图谱的构建过程中,通常需要对数据库中的每条知识进行打标签处理,而现有技术中,通常是由人工根据经验对每条知识进行打标签,为知识图谱的构建提供数据基础,进而可以通过索引的方式查询到想要的食品安全知识。而人工进行打标签的方式不仅效率低、时间周期长,而且由于每个人的主观意识不同,对于标签的赋予具有一定的误判性。
因此,如何克服食品安全图谱构建过程中人工打标签所带来的时间周期长、效率低以及主观因素的误判性缺陷,是本领域技术人员亟需解决的问题。
发明内容
有鉴于此,本发明提供了一种食品安全标准关联知识图谱构建方法及系统。
为了实现上述目的,本发明提供如下技术方案:
一种食品安全标准关联知识图谱构建方法,包括以下步骤:
步骤1、获取食品安全标准数据源;
步骤2、对食品安全标准数据源中的结构化数据和非结构化数据进行语义识别,得到知识数据集;
步骤3、对知识数据集中的每条知识打标签;
步骤4、依据标签所代表的实体之间的关系,构建食品安全标准关联知识图谱。
可选的,食品安全标准数据源的获取途径包括从国家标准文件中获取的结构化数据,以及通过网络爬虫从网络中获取的结构化数据和非结构化数据。
可选的,所述步骤2中,语义识别包括文本语义识别、图像语义识别、语音语义识别等。
可选的,在所述步骤2中,得到知识数据集之后,需要进行数据预处理,包括数据的合并、去重等,减少后续打标签过程的数据处理量,提高数据处理效率。
可选的,所述步骤3中对每条知识打标签的具体方法为:
步骤3.1、对每条知识进行分词处理;
步骤3.2、基于TF-IDF算法,计算每条知识中每个分词所占权重;
步骤3.3、将每条知识中每个分析的权重和预设阈值进行比较,将符合阈值条件的分词作为该条知识的标签。
可选的,在所述步骤3.1中,对每条知识进行分词处理的方法为:
步骤3.1.1、依据食品安全词典或开源的词法工具,采用正向最大匹配法、反向最大匹配法、TextRank算法中的至少一种方法,对每条知识进行分词;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国标准化研究院,未经中国标准化研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211087778.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于全断面岩层盾构管片背后补浆装置
- 下一篇:一种燃料电池电堆