[发明专利]舆情线索处理方法、系统、可读存储介质及计算机设备有效
申请号: | 201911203577.1 | 申请日: | 2019-11-29 |
公开(公告)号: | CN111046264B | 公开(公告)日: | 2023-07-21 |
发明(设计)人: | 张弛;周继斌;江泊;肖武林;邓智诚;肖恒;石望来;胡堃 | 申请(专利权)人: | 江西省天轴通讯有限公司 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/9538 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 彭琰 |
地址: | 330000 江西省南昌*** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 舆情 线索 处理 方法 系统 可读 存储 介质 计算机 设备 | ||
1.一种舆情线索处理方法,其特征在于,所述方法包括:
通过预设的舆情抓取方案对全网的舆情信息按进行抓取,以获取多条舆情线索;
按照价值指数生成规则计算每条所述舆情线索的价值指数,并依据价值指数的高低对每条所述舆情线索进行排序;
当所有的所述舆情线索中某一目标舆情线索的价值指数超过设定的阈值时,对所述目标舆情线索标记,并通过醒目的方式进行展示;
所述预设的舆情抓取方案包括方案名称的配置,公益类型的配置、信息载体的配置、逻辑关键词的配置、过滤关键词的配置;
所述方案名称的配置用于标记每次舆情抓取程序的执行序列;
所述公益类型的配置用于确定公益诉讼案件涉及的领域;
所述信息载体的配置用于确定舆情信息发布的网络平台;
所述逻辑关键词的配置用于确定多个关键词之间的逻辑关系,所述关键词用于匹配网络平台上的舆情信息;
所述过滤关键词的配置用于当舆情信息中存在过滤关键词中的一个或多个时,则该舆情信息不进入舆情信息抓取列表;
所述按照价值指数生成规则计算每条所述舆情线索的价值指数的步骤中,采用以下公式计算所述舆情线索的价值指数:
JCI=20%×M+{80%×[G1×ln(C1+1)+G2×ln(C2+1)+G3×ln(C3+1)+G4×ln(C4+1)......+Gn×ln(Cn+1)]}×10;
其中,JCI表示价值指数,M表示所述舆情线索的来源的媒体权威度,G表示关键词准确性,C表示关键词的匹配次数。
2.根据权利要求1所述的舆情线索处理方法,其特征在于,所述通过预设的舆情抓取方案对全网的舆情信息按进行抓取的步骤包括:
根据配置的信息载体圈定需要检索舆情信息的目标网络平台;
根据所述舆情抓取方案中逻辑关键词的配置圈定的所述目标网络平台上的文章信息,并将圈定的文章信息抓取到待过滤列表中;
利用所述舆情抓取方案中过滤关键词的配置检索所述待过滤列表中的信息,当所述待过滤列表中存在任一关键词与所述过滤关键词匹配时,则将该信息从所述待过滤列表中移除;
根据所述舆情抓取方案中公益类型的配置对所述待过滤列表进行公益类型分类处理,并存入相应的数据库表中。
3.根据权利要求2所述的舆情线索处理方法,其特征在于,所述逻辑关键词包括第一逻辑词和第二逻辑词,所述第一逻辑词为与,所述第二逻辑词为或;
当所述逻辑关键词为所述第一逻辑词时,多个关键词之间是并列的关系,对抓取的舆情信息需要包含与关键词中的所有的关键词;
当所述逻辑关键词为所述第二逻辑词时,多个关键词之间是相互独立的关系,对于抓取的舆情信息只需包含或关键词中的任何一个。
4.根据权利要求3所述的舆情线索处理方法,其特征在于,所述根据所述舆情抓取方案中逻辑关键词的配置圈定的所述目标网络平台上的文章信息的步骤包括:
当文章信息中存在所述第一逻辑词中的所有关键词或者第二逻辑词中的任一关键词时,则将该文章信息抓取到所述待过滤列表中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江西省天轴通讯有限公司,未经江西省天轴通讯有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911203577.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:磨削装置及使用该磨削装置的平面磨床
- 下一篇:光电二极管及其制备方法