[发明专利]舆情预警以及风险传播分析方法、系统、设备及存储介质有效
申请号: | 202010021613.9 | 申请日: | 2020-01-09 |
公开(公告)号: | CN111241300B | 公开(公告)日: | 2023-05-05 |
发明(设计)人: | 季鹏;闭思泽;冯瑜;范相儒;程序 | 申请(专利权)人: | 中信银行股份有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06F16/38;G06Q10/0635 |
代理公司: | 北京市兰台律师事务所 11354 | 代理人: | 张峰 |
地址: | 100010 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 舆情 预警 以及 风险 传播 分析 方法 系统 设备 存储 介质 | ||
1.一种基于知识图谱的实时负面舆情预警以及风险传播分析方法,包括:
S1.实时获取关注的不同领域板块的各类资讯,获取后封装成资讯数据流继续传递;
S2.获取所述数据流中的资讯文本,然后对该资讯文本进行风险评级;
S3.抽取数据流中资讯文本事件中的涉事主体;
S4.根据所述涉事主体的相关信息,到构建的知识图谱中查询,获取该涉事主体的详细属性,同时识别风险通过该涉事主体可能扩散到的关联主体;
所述关联主体包括显式关联主体和隐式关联主体;
所述显式关联主体为在知识图谱中与涉事主体有直接或间接关系的个体;
所述隐式关联主体为通过图嵌入计算,基于知识图谱中的关系图,利用图嵌入算法将实体向量化,得到embedding矩阵,然后查找到涉事主体的向量表示,计算出与涉事主体相似性最高的其他多个主体;
S5.基于所述关联主体,计算其与所述涉事主体的关系强度,再结合风险等级,分析关联主体受风险传播的影响程度,得到关联风险评分;
S6.将计算得出的高风险主体、关联主体以及关联风险评分发出进行相关业务提醒。
2.如权利要求1所述的分析方法,其特征在于,步骤S2中,首先将未标注数据集分为小部分待手动标注数据集和大部分待自动标注数据集,对待自动标注数据集上进行推理预测,人工抽样审核预测结果,将所有可用的已标注数据用于训练小参数量模型,训练完的模型将其封装成接口等待调用。
3.如权利要求1所述的分析方法,其特征在于,步骤S3中,增加短期缓存,存储该段时间内处理过的新闻资讯文本向量,在一个新消息待处理之前,先和缓存内的文本向量计算相似度,相似度高于阈值则认为该新闻之前已经处理过,不再重复发送。
4.如权利要求1所述的分析方法,其特征在于,步骤S4中,基于所述知识图谱,形成多个真实实体-关系序列,基于这些序列,利用图嵌入算法,将高维不可进行数值计算的自然实体转化为低维可计算的实体向量。
5.如权利要求1所述的分析方法,其特征在于,步骤S5中,显式关联主体与涉事主体之间的显式关系强度采用以下公式量化:
上式表示A对其他节点X的影响力,其中P(A,X)为A到X的所有关系路径p的集合,p为P(A,X)集合中的元素,也是一条关系序列;
其中,Q(A,X,r)表示AX之间关系r的取值,分母则表示所有与X存在关系r的取值总和。
6.如权利要求1或5所述的分析方法,其特征在于,步骤S5中,隐式关联主体与涉事主体之间的隐式关系强度的计算基于图嵌入算法获得的实体embedding矩阵,首先,查找涉事主体的向量表示VA,然后利用以下公式涉事主体与其他各个主体的向量相似度:
选取相似度最高的多个主体作为隐式关联主体,相似度值即为AX之间的隐式关系强度;
显示关联主体与涉事主体之间也存在隐式联系,统一隐式关联与显示关联关系强度,采用关系强度计算公式:
S(A,X)=λeSe(A,X)+λiSi(A,X);
其中,S(A,X)代表AX之间关系总强度,λe与λi分别是显示关系强度和隐式关系强度系数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中信银行股份有限公司,未经中信银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010021613.9/1.html,转载请声明来源钻瓜专利网。