[发明专利]一种基于神经网络模型的食品安全事件分类方法及装置在审
申请号: | 201910754927.7 | 申请日: | 2019-08-15 |
公开(公告)号: | CN110457562A | 公开(公告)日: | 2019-11-15 |
发明(设计)人: | 郑丽敏;郑瑾 | 申请(专利权)人: | 中国农业大学 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/35;G06F16/36;G06F16/387;G06F17/27;G06N3/04;G06Q50/26 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100083北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 食品安全 分类 注意力机制 神经网络 双向循环 嵌入层 构建 网站 地理位置信息 神经网络模型 文本分类模型 上下文信息 安全事件 词性标注 分级标准 国家食品 情感分析 事件分类 文本特征 语义依赖 正文提取 专用词典 长文本 停用词 网络层 分词 权重 捕获 文本 分配 | ||
1.一种基于神经网络模型的食品安全事件分类方法,其特征在于,包括:
从各省市食品安全信息发布的网站获取食品安全事件的相关数据;
根据所述食品安全事件的相关数据构建食品安全领域专用词典,情感分析词典和地理位置信息词典;
根据所述食品安全领域专用词典,所述情感分析词典和所述地理位置信息词典对所述食品安全事件的相关数据进行正文提取、分词、去停用词和词性标注预处理;
将文本分类模型用于提取预处理后文本的特征,所述模型由四个网络层组成:词嵌入层,双向循环神经网络层,注意力机制层和分类层;所述词嵌入层用于对文本的分布式表示,word2vec网络中的skip-gram模型将文本表示成词向量,所述双向循环神经网络层用于捕获长文本的上下文信息和语义依赖关系且双向的网络结构可缓解信息不平衡的问题,所述注意力机制层根据文本特征对分类的重要性使用双线性注意力函数,以较少的参数获得隐藏层状态间的交互为这些特征分配不同的权重,所述分类层实现最终的食品安全事件的分类。
2.根据权利要求1所述的一种基于神经网络模型的食品安全事件分类方法,其特征在于,所述食品安全事件的获取来源于各地政府、企事业单位、科研机构等专门发布食品安全信息的网站。
3.根据权利要求1所述的一种基于神经网络模型的食品安全事件分类方法,其特征在于,所述食品安全领域专用词典包括食品添加剂、农药、兽药、天然毒素、化学污染物中的专有名词,所述情感分析词典包括大量的与食品安全事件描述相关的正面和负面的情感词汇,所述地理位置信息词典包含中国省份、城市、区县、乡镇和村庄的地理位置名词。
4.根据权利要求1所述的一种基于神经网络模型的食品安全事件分类方法,其特征在于,对所述食品安全事件的相关数据的预处理包括根据所述词典对食品安全事件进行分词,去除无效信息,对书写不规范的词规范化处理,还原缩略词,删除有歧义的网络用语和表情符号。
5.根据权利要求1所述的一种基于神经网络模型的食品安全事件分类方法,其特征在于,所述文本分类模型由四个网络层组成:词嵌入层,双向循环神经网络层,注意力机制层和分类层;
所述词嵌入层用于文本的分布式表示,使用word2vec网络中skip-gram模型训练词向量,将每个词训练后表示成为一个低维、连续的实值向量;
所述双向循环神经网络层中使用的是双向的长短期记忆网络(LSTM),所述网络使用一种“门”的存储结构实现去除或者增加信息的功能,通过学习控制信息流,捕获句子中词之间的长期依赖性;所述网络的双向结构由两个相反方向的循环层组成,分别从正向和反向返回两个隐藏状态序列,连接成一个固定维数的向量,来减轻因文本过长而造成的信息量不平衡问题;
所述注意力机制层将所述双向循环神经网络层生成的文本表示作为判别基准,学习不同位置的状态权重,对文本分类更重要的特征被赋予更高的权重,使用向量的加权线性组合来获得最优的特征维数;所述注意力机制层使用的注意力得分函数是双线性注意力函数,可使用较少的参数获得所述隐藏层状态间的交互;
所述分类层使用的是一个逻辑回归分类器,将所述注意力机制层的固定维数作为输入,仿射变换后由softmax函数计算食品安全事件被分为特别重大事件、重大事件、较大事件和一般事件的概率。
6.根据权利要求1所述的一种基于神经网络模型的食品安全事件分类方法,其特征在于,所述文本分类模型对食品安全事件分类的标准分为特别重大:食品安全事件影响范围涉及2个以上省份,出现30人以上死亡,造成特别严重的健康损害后果;重大:食品安全事件影响范围涉及2个以上社区市,造成健康损害人数在100人以上并出现死亡病例,或出现10人以上、30人以下死亡,发现在我国首次出现的新的污染物引起的食品安全事件,造成严重健康损害后果,并有扩散趋势;较大:食品安全事件影响范围涉及2个以上县(市、区),造成健康损害人数在100人以上,或出现10人以下死亡病例,造成较为严重的健康损害后果;一般:存在健康损害的污染食品,在1个县(市、区)行政区内造成严重健康损害后果,食品安全事件造成健康损害人数在30人以上、100人以下,且未出现死亡病例。
7.一种基于神经网络模型的食品安全事件分类装置,其特征在于,所述装置包括:
获取模块,用于获取待分类的食品安全事件;
构建模块,用于根据所述食品安全事件构建食品安全领域专用词典,情感分析词典和地理位置信息词典;
处理模块,将所述的食品安全事件进行预处理,包括去重、删除无效信息、分词、去停用词和词性标注;
分类模块,将预处理后的食品安全事件输入所述分类模型,输出所述食品安全事件的类别;其中,所述神经网络模型是经过多次训练、调参、取优后得到的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国农业大学,未经中国农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910754927.7/1.html,转载请声明来源钻瓜专利网。