[发明专利]一种基于神经网络模型的食品安全事件分类方法及装置在审
申请号: | 201910754927.7 | 申请日: | 2019-08-15 |
公开(公告)号: | CN110457562A | 公开(公告)日: | 2019-11-15 |
发明(设计)人: | 郑丽敏;郑瑾 | 申请(专利权)人: | 中国农业大学 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/35;G06F16/36;G06F16/387;G06F17/27;G06N3/04;G06Q50/26 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100083北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 食品安全 分类 注意力机制 神经网络 双向循环 嵌入层 构建 网站 地理位置信息 神经网络模型 文本分类模型 上下文信息 安全事件 词性标注 分级标准 国家食品 情感分析 事件分类 文本特征 语义依赖 正文提取 专用词典 长文本 停用词 网络层 分词 权重 捕获 文本 分配 | ||
本发明涉及一种基于神经网络模型的食品安全事件分类方法。该方法包括:从网站获取食品安全事件的相关数据;构建食品安全领域专用词典,情感分析词典和地理位置信息词典;对获取的数据进行正文提取、分词、去停用词和词性标注处理;构建文本分类模型,该模型由四个网络层组成:词嵌入层,双向循环神经网络层,注意力机制层和分类层。词嵌入层用于文本的分布式表示,双向循环神经网络层用于捕获长文本的上下文信息和语义依赖关系,注意力机制层根据文本特征对分类的重要性为其分配不同的权重,最后使用分类层实现食品安全事件的分类。本方法能够根据国家食品安全事件分级标准,对网站上获取的食品安全事件进行快速准确的分类。
技术领域
本发明涉及人工智能和计算机技术领域,更具体的,涉及一种基于神经网络模型的食品安全事件分类方法及装置。
背景技术
随着经济和社会的发展,食品安全已成为人民群众日常生活中的热点问题,民众对食品安全提出了更高的诉求。近年来,农药残留超标、食品添加剂过量等各类食品安全事件在我国频繁发生,我国食品安全现状不容乐观。互联网上有海量的食品安全相关信息,记录了食品安全模式的演化过程,蕴含了事件发展规律。通过获取食品安全状态、分析食品安全事件的发展规律并对可能发生的事件预警,能够保障社会食品安全、建立有效监管规范、减少事件发生造成的损失。然而这些食品安全信息,涉及各个领域,形式复杂多样,主题内容繁多,不利于人们快速、有效的获取有用的信息,如何从海量的互联网资源中提取出有效的食品安全相关信息,如何利用相关事件发展规律进行食品安全事件的判别、分析与预警,是食品安全领域需要研究的内容。利用数据挖掘中文本分类的方法能够获取更多有价值且更具有针对性的信息,方便相关部门根据这些不同种类的食品安全事件发生的特点,采取相应的监管和预防措施。
现有的传统的有监督学习文本分类方法侧重于设计手工制作的特征,但由于食品安全事件具有有限的上下文信息和稀疏的语义,很难获得有用的分类特征,并且食品安全信息中包含一些对分类起决定性作用的词语,而传统的有监督学习文本分类方法无法将其提取出。食品安全领域的文本包含大量的专有名词,食品安全事件一般也都会涉及发生区域,传统的有监督学习文本分类方法不能有效的把这些专有名词提取出来,大大降低了分类效果。
为了解决上述问题,需要一种基于深度学习的方法尤其是神经网络模型用于食品安全事件的分类,不需要繁琐的人工特征工程,能够有效的提取相关特征,使用注意力机制动态学习有助于分类决策的词语,并在食品安全事件分类模型中添加食品安全领域专用词典,情感分析词典和地理位置信息词典,提高模型的分类性能,以便准确获取有效的食品安全信息。
发明内容
为了将食品安全事件快速准确的分类,能够获取更多有价值且更具有针对性的信息,本发明提供了一种基于神经网络模型的食品安全事件分类方法,包括:
从各省市食品安全信息发布的网站获取食品安全事件的相关数据;
根据所述食品安全事件的相关数据构建食品安全领域专用词典,情感分析词典和地理位置信息词典;
根据所述食品安全领域专用词典,情感分析词典和地理位置信息词典对所述食品安全事件的相关数据进行正文提取、分词、去停用词和词性标注等预处理;
将所述文本分类模型用于提取所述预处理后文本的特征,所述模型由四个网络层组成:词嵌入层,双向循环神经网络层,注意力机制层和分类层。所述词嵌入层用于对文本的分布式表示,word2vec网络中的skip-gram模型将文本表示成词向量,所述双向循环神经网络层用于捕获长文本的上下文信息和语义依赖关系且双向的网络结构可缓解信息不平衡的问题,所述注意力机制层根据文本特征对分类的重要性使用双线性注意力函数,以较少的参数获得隐藏层状态间的交互为这些特征分配不同的权重,所述分类层实现最终的食品安全事件的分类。
优选地,所述食品安全事件的获取来源于各地政府、企事业单位、科研机构等专门发布食品安全信息的网站。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国农业大学,未经中国农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910754927.7/2.html,转载请声明来源钻瓜专利网。