[发明专利]基于语义特征强化的深度学习预警方法、系统及电子设备在审
申请号: | 202110304374.2 | 申请日: | 2021-03-22 |
公开(公告)号: | CN113051367A | 公开(公告)日: | 2021-06-29 |
发明(设计)人: | 韩勇;赵冲;李青龙;骆飞 | 申请(专利权)人: | 北京智慧星光信息技术有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F16/36;G06F16/953 |
代理公司: | 北京智宇正信知识产权代理事务所(普通合伙) 11876 | 代理人: | 李明卓 |
地址: | 100080 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 语义 特征 强化 深度 学习 预警 方法 系统 电子设备 | ||
本发明公开了一种基于语义特征强化的深度学习预警方法、系统及电子设备,该方法包括:将预先训练好的文本词向量作为textcnn模型的词向量嵌入层;将关键词词词向量化特征矩阵、主题词词向量化特征矩阵和情感特征词词向量化矩阵作为textcnn模型的语义特征强化层;将训练语料集输入由textcnn模型和xgboost模型构成的堆叠模型中进行训练得到最优堆叠模型;将在线预测数据输入最优堆叠模型中得到加强特征textcnn计算的类别权值和xgboost计算的类别权值;根据预设情感词典和多种词汇的权值得到文本情感计算的权值;对文本情感计算的权值、加强特征textcnn计算的类别权值和xgboost计算的类别权值进行融合加权计算,得到最终类别权值;根据最终权重值得到预警结果。该方法提高了文本预警的准确性。
技术领域
本发明涉及互联网数据处理领域,具体涉及到一种基于语义特征强化的深度学习预警方法、系统、电子设备及存储介质。
背景技术
随着互联网的普及和移动互联网的崛起,媒体以及自媒体时代的到来,网络内容巨增。互联网和移动互联网的快速发展使网络平台成为人们进行消息获取、交流和知识共享的主流平台。
现有的重大突发事件预警方案通常是根据关键字进行匹配,也就是通过负面词典进行匹配,负面词语前面加上否定词后就会变成正面词,仅通过字典匹配无法把握文章的真实语义,需要大量的收集和积累词库,对于语义反转,一词多意的情况无法判断,故通过词典匹配存在预警不准确的问题。
发明内容
有鉴于此,本发明实施例提供了一种基于语义特征强化的深度学习预警方法、系统、电子设备及存储介质,以解决现有技术中文本预警不准确的缺点。
为此,本发明实施例提供了如下技术方案:
根据第一方面,本发明实施例提供了一种基于语义特征强化的深度学习预警方法,包括:获取训练语料集;对训练语料集进行分词处理得到训练语料集的分词文本;获取预先训练好的文本词向量,将所述文本词向量作为textcnn模型的词向量嵌入层;通过关键词提取模型对训练语料集进行关键词特征提取,得到文本关键词;对文本关键词进行词向量化得到关键词词向量化特征矩阵;通过主题模型对训练语料集进行主题特征提取,得到文本主题词;对文本主题词进行词向量化得到主题词词向量化特征矩阵;通过预设情感词典对分词文本进行情感特征提取,得到文本情感词;对文本情感词进行词向量化得到情感特征词词向量化矩阵;将关键词词词向量化特征矩阵、主题词词向量化特征矩阵和情感特征词词向量化矩阵作为textcnn模型的语义特征强化层;将训练语料集输入由textcnn模型和xgboost模型构成的堆叠模型中进行训练,得到最优堆叠模型;获取在线预测数据;将所述在线预测数据输入最优堆叠模型中得到加强特征textcnn计算的类别权值和xgboost计算的类别权值;根据预设情感词典,负面词的预设情感权值、正面词的预设情感权值、中性词的预设情感权值、反转词的预设情感正负方向权值和加强语气词的加强倍数权值得到文本情感计算的权值;对文本情感计算的权值、加强特征textcnn计算的类别权值和xgboost计算的类别权值进行融合加权计算,得到最终类别权值;根据最终类别权值进行类别判断,得到预警结果。
可选地,获取预先训练好的文本词向量的步骤中,包括:获取训练词向量模型;通过训练词向量模型对分词文本进行文本词向量化和语义特征迁移学习得到预先训练好的文本词向量。
可选地,通过关键词提取模型对训练语料集进行关键词特征提取,得到文本关键词的步骤中,包括:通过关键词提取模型对训练语料集中的每篇文章分别进行关键词特征提取,得到每篇文章的关键词和所对应的关键词权重值;按照每篇文章的关键词权重值分别对每篇文章中的关键词进行降序排列,得到每篇文章的排序关键词;从每篇文章的排序关键词的起始位置开始,选取第一预设数量的排序关键词作为每篇文章所对应的核心关键词;根据每篇文章的核心关键词得到训练语料集的文本关键词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京智慧星光信息技术有限公司,未经北京智慧星光信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110304374.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种业务数据清洗方法及装置
- 下一篇:一种消除轴线漂移的柔性转动副机构