[发明专利]一种舆情知识库构建方法及舆情知识库有效
申请号: | 202010752163.0 | 申请日: | 2020-07-30 |
公开(公告)号: | CN111914141B | 公开(公告)日: | 2023-01-10 |
发明(设计)人: | 黄涛;程朴;何莹;龚勋;万忠平;梁少勇 | 申请(专利权)人: | 广州城市信息研究所有限公司 |
主分类号: | G06F16/906 | 分类号: | G06F16/906;G06Q50/00 |
代理公司: | 广州智丰知识产权代理事务所(普通合伙) 44655 | 代理人: | 凌衍芬 |
地址: | 510665 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 舆情 知识库 构建 方法 | ||
1.一种舆情知识库构建方法,其特征在于,包括:
采集历史舆情控制案例;
根据所述历史舆情控制案例生成事件对象,所述事件对象包括事件标识、开始时间、结束时间、事件主题、事件关键词、事件简介;
提取所述历史舆情控制案例中每个句子的施事词汇、受事词汇、地点词汇和谓词;
当所述施事词汇或受事词汇属于同一类舆情人物词库,且所述施事词汇或所述受事词汇或所述谓词属于同一类舆情事件词库,则将所述历史舆情控制案例所对应生成的事件对象分类为同一类;
或者,当所述地点词汇属于同一类舆情地点词库,且所述施事词汇或所述受事词汇或所述谓词属于同一类舆情事件词库,则将所述历史舆情控制案例所对应生成的事件对象分类为同一类;
将所述事件对象存储为舆情案例库;
将分类后的所述历史舆情控制案例分类存储为舆情案例库;
在提取所述历史舆情控制案例中每个句子的施事词汇、受事词汇、地点词汇和谓词之后,还包括:
将所提取的所述施事词汇、所述受事词汇、所述地点词汇和所述谓词标注为关键词;
将所述关键词与实体敏感库中的词汇进行匹配,将与所述实体敏感库中的词汇相匹配的所述关键词标注为舆情关键词;
所述将分类后的所述历史舆情控制案例分类存储为舆情案例库包括:
将所述历史舆情控制案例的属性结构与舆情案例库中的舆情案例的属性结构进行相似性匹配,得到所述历史舆情控制案例所属的事件类型,具体包括:设所述历史舆情控制案例为X,X所属的事件类型为第x个事件类型Cx,舆情案例库中属于事件类型Cx的某舆情案例为txj,舆情案例库中第i类事件类型为Ci,X和舆情案例库中每一舆情案例均包括若干属性,计算X与Ci的相似度
γ为经验因子,q为X的属性个数,qs为X与Ci的相同的属性个数,k为Ci的属性个数;
根据S(X,Cx),判断X所属的事件类型与第x类Cx是否为同一类,具体为:
预设阈值τ,当最大的结构相似度S(X,Cx-max)大于预设阈值τ时,可以认为对应的X所属的事件类型为第x-max个事件类型Cx-max;
nxj为舆情案例库中属于Cx且与X的属性相匹配的舆情案例个数,n为舆情案例库中的舆情案例,Xy为X的属性,nxj(Xy)为事件类型Cx中具有属性Xy的舆情案例个数,ωxy是事件类型Cx的属性权重;
根据条件概率p(X|txj)p(txj),可以判断得到最相似的舆情案例。
2.根据权利要求1所述的舆情知识库构建方法,其特征在于,还包括:
建立舆情主题;
根据所述舆情主题生成多级主题对象,所述主题对象包括主题级别和主题名称;
将所述主题对象存储为舆情主题库。
3.根据权利要求2所述的舆情知识库构建方法,其特征在于,还包括:
建立以传播扩散性、民众关注度、内容敏感性和态度倾向性作为一级评估指标的多级评估指标;
根据所述评估指标生成评估指标对象,所述评估指标对象包括指标级别和指标名称;
将所述评估指标对象存储为舆情评估指标库。
4.根据权利要求3所述的舆情知识库构建方法,其特征在于,还包括:
根据所述评估指标的一个或多个建立预警等级;
根据所述预警等级生成预警等级对象,所述预警等级对象包括等级编号、等级名称、标示颜色和判断标准;
将所述预警等级对象存储为舆情预警等级库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州城市信息研究所有限公司,未经广州城市信息研究所有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010752163.0/1.html,转载请声明来源钻瓜专利网。