[发明专利]新闻事件的舆情处理方法及装置、存储介质、计算机设备在审
申请号: | 202011526767.X | 申请日: | 2020-12-22 |
公开(公告)号: | CN112650923A | 公开(公告)日: | 2021-04-13 |
发明(设计)人: | 赵亮 | 申请(专利权)人: | 深圳壹账通智能科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06K9/62;G06N3/04;G06N3/08;G06N20/00 |
代理公司: | 北京中强智尚知识产权代理有限公司 11448 | 代理人: | 黄耀威 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 新闻 事件 舆情 处理 方法 装置 存储 介质 计算机 设备 | ||
本发明公开了一种新闻事件的舆情处理方法及装置、存储介质、计算机设备,涉及人工智能领域,主要目的在于解决现有新闻事件的舆情处理效率低的问题。包括:获取已采集的新闻舆情信息;根据已完成训练的第一文本分类模型对所述新闻舆情信息进行第一次分类处理;提取与所述第一次分类处理得到的第一分类标记匹配的且已完成训练的第二文本分类模型,并根据所述第二文本分类模型对匹配所述第一分类标记的新闻舆情信息进行第二次分类处理;从所述第二次分类处理确定第二分类标记的所述新闻舆情信息中提取新闻事件内容,并结合所述第一分类标记、所述第二分类标记将所述新闻事件内容映射至与所述舆情需求匹配的事理图谱中的对应节点处,进行输出。
技术领域
本发明涉及人工智能技术领域,特别是涉及一种新闻事件的舆情处理方法及装置、存储介质、计算机设备。
背景技术
随着舆情系统的快速发展,越来越多的多媒体企业利用舆情系统来获取大量具有前沿特征的舆情信息,例如竞争公司、上下游相关联公司的融资关系,对手或关联企业的运营情况等。
目前,现有舆情系统获取数据的方法普遍是利用网络新闻中的内容直接收集舆情信息,对爬取的舆情信息进行人工分析处理,从而挖掘出针对新闻内容有用的信息,然而,这些从散落在各互联网网站的新闻内容,过于零散,不同类型的企业无法满足自身需求快速的找到需要的信息,需要专业分类性强的人员进行长时间、高强度的数据整理、分析处理才能有效得到企业需要的内容,使得长时间对收集的包含有新闻类的舆情信息进行处理又会影响信息的时效性,影响舆情信息对企业的影响作用,又消耗了大量人力资源,从而降低了企业对包含有新闻内容的舆情信息的处理效率。
发明内容
有鉴于此,本发明提供一种新闻事件的舆情处理方法及装置、存储介质、计算机设备,主要目的在于解决现有新闻事件的舆情处理效率低的问题。
依据本发明一个方面,提供了一种新闻事件的舆情处理方法,包括:
获取已采集的新闻舆情信息,所述新闻舆情信息为包含各新闻事件的文字内容的信息;
根据已完成训练的第一文本分类模型对所述新闻舆情信息进行第一次分类处理;
提取与所述第一次分类处理得到的第一分类标记匹配的且已完成训练的第二文本分类模型,并根据所述第二文本分类模型对匹配所述第一分类标记的新闻舆情信息进行第二次分类处理,所述第一分类标记为对所述第一次文本分类模型训练过程中从不同舆情需求训练样本集中自动标记确定的;
从所述第二次分类处理确定第二分类标记的所述新闻舆情信息中提取新闻事件内容,并结合所述第一分类标记、所述第二分类标记将所述新闻事件内容映射至与所述舆情需求匹配的事理图谱中的对应节点处,进行输出。
进一步地,所述方法还包括:
构建三层卷积神经网络模型,基于预设的三个核特征值从训练样本集中的各完成第一分类标记的新闻文本内容中提取特征信息;
基于池化层对所述特征信息进行特征筛选,拼接筛选后的特征向量,并利用所述训练样本集对所述三层卷积神经网络模型进行训练;
利用adam优化器对训练过程中的所述三层卷积神经网络模型进行优化,直至完成所述三层卷积神经网络模型训练,得到第一文本分类模型。
进一步地,所述构建三层卷积神经网络模型之前,所述方法还包括:
获取待标记的新闻文本内容,并确定舆情需求;
根据所述舆情需求确定K-means聚类中的k值,对所述新闻文本内容进行聚类,并提取聚类后不同聚类簇中文本词的出现次数超过预设阈值的特征词语,作为第一分类标记内容;
基于所述第一分类标记内容对完成聚类的不同聚类簇进行第一标记分类。
进一步地,所述方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳壹账通智能科技有限公司,未经深圳壹账通智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011526767.X/2.html,转载请声明来源钻瓜专利网。