[发明专利]一种面向食品安全事件的预警方法在审
申请号: | 201910898339.0 | 申请日: | 2019-09-23 |
公开(公告)号: | CN110688557A | 公开(公告)日: | 2020-01-14 |
发明(设计)人: | 郑丽敏;郭心全 | 申请(专利权)人: | 中国农业大学 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06Q50/26 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100083 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 食品安全 预处理 事件分析 预警 分词 爬虫 词性标注 动态渲染 结果构建 时间类型 事件发生 事件级别 特征确定 文本特征 预警模型 预警信息 预知事件 增量更新 专用词典 词向量 停用词 构建 加载 去噪 去重 发布 危害性 扩散 互联网 评估 预防 分析 网络 | ||
本发明涉及面向食品安全事件的预警方法:使用动态渲染和增量更新的爬虫机制从互联网上爬取2000年至目前食品安全事件的数据;构建并加载食品安全领域专用词典;通过去重、去噪、利用分词工具分词、去停用词和词性标注操作进行预处理;将预处理后的文本特征生成词向量,判断是否为食品安全事件;将食品安全事件根据发展特征确定时间类型;对事件分析评估,核定事件级别,进行预警;对食品安全事件的致因分析,判断对其他食品的危害性并发布预警信息。及时地对网络上发布的食品安全事件分析处理并根据结果构建预警模型,通过对食品安全事件的预警预知事件的危害程度,并及时采取相应措施防止大规模扩散,预防有危害趋势的事件发生。
技术领域
本发明涉及人工智能、计算机技术以及食品安全领域,具体涉及一种面向食品安全事件的预警方法。
背景技术
随着社会和经济的发展,人们的生活越来越富裕,对于温饱问题已经解决的人们来说,吃的健康更为重要,因此食品安全成了人们最关心的问题之一。但是为了商业利益,商家们不择手段做出违法的事情,食品安全事件时有发生,如何让消费者及时了解详细情况和对发生的食品安全事件进行预防和控制,对食品安全问题管理、控制、决策提供依据。
现有的食品安全预警,主要分为两种:事前预防和事中控制。由于缺乏开放链接数据和开放知识库,食品生成经过的种植(养殖)、加工、包装、储藏、运输、销售、消费各步骤检测数据无法直接获取,这样就导致了事前预防有着很大的难度。为了解决这些问题,研究者们采用实体和虚拟相结合的方法,从各个方面寻找现有的数据,以便准确的预警。
由于互联网的快速发展,食品安全事件的数据的获取较为容易,且较为及时。而获取数据后的预处理阶段也有前人研究,需要做的是根据自身情况来改动。难点在于如何设计分析已发生的食品安全事件的致因,去预警有可能发生的食品安全事件。
因此,目前的食品安全预警,缺乏能够对已发生的食品安全事件进行分类及根据类别预警和缺乏对食品安全事件的致因分析以及对其他食品造成的影响的预警方法。
发明内容
为了解决食品安全预警问题,对已发生的食品安全事件的性质 (安全隐患型事件、单一型事件、可扩展型事件、频发型事件)以及致因(添加剂超标、农药残留、兽药残留、食源性微生物超标、污染物超标等)分析判断和可能对其他食品造成的影响的预警方法,本发明提供了一种面向食品安全事件的预警方法,包括:
使用动态渲染和增量更新的爬虫机制及时从互联网上各大门户网站爬取食品安全事件,获取事件的发生时间范围是2000年至目前(即 2019年),数据格式包含结构化数据(检测数据)与非结构化数据(新闻文本数据)。所述动态渲染是指使用Selenium工具对于需要点击下一页等操作的网页进行模拟点击;所述增量更新是指只爬取当天更新的事件,而对于已经爬过的事件不再重复爬取。
所述食品安全事件构建食品安全领域专用词典,包括食品安全事件中的专属名词、食品企业信息、农药、兽药和食品添加剂领域的专属名词等。所述食品安全事件的词典是基于大量有关食品安全领域的知识来来构建的,用以分词时以正确识别该领域的词语的一个工具,防止分词有误。
根据所述食品安全事件和食品安全领域专用词典进行预处理,包括去重、去噪、利用开源性分词工具jieba进行分词、去停用词和词性标注等操作;
根据所述食品安全事件文本中的词将其进行数学化的表示,使用 one-hot模型生成词向量,向量中的每一个元素都关联着词库中的一个单词,在向量中对应的元素设置为1,其它元素设置为0;
根据所述判断是否为食品安全事件,是指若是结构化数据(检测数据),则根据检测结果合格不合格等特征来判定是否为食品安全事件;若是非结构化数据(新闻文本数据),则采用正则匹配法匹配标题及正文中关键词,根据关键词对词向量、词频等特征来判定是否为食品安全事件。所述正则匹配法是对标题和正文都进行匹配,检查是否包含食品名称、添加剂名称、微生物名称等词和出现次数(即词频)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国农业大学,未经中国农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910898339.0/2.html,转载请声明来源钻瓜专利网。