[发明专利]舆情预警以及风险传播分析方法、系统、设备及存储介质有效
申请号: | 202010021613.9 | 申请日: | 2020-01-09 |
公开(公告)号: | CN111241300B | 公开(公告)日: | 2023-05-05 |
发明(设计)人: | 季鹏;闭思泽;冯瑜;范相儒;程序 | 申请(专利权)人: | 中信银行股份有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06F16/38;G06Q10/0635 |
代理公司: | 北京市兰台律师事务所 11354 | 代理人: | 张峰 |
地址: | 100010 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 舆情 预警 以及 风险 传播 分析 方法 系统 设备 存储 介质 | ||
本发明提供一种基于知识图谱的实时负面舆情预警以及风险传播分析方法、系统、设备及存储介质,分析方法包括:S1.实时获取关注的不同领域板块的各类资讯,获取后封装成资讯数据流继续传递;S2.获取所述数据流中的资讯文本,然后对该资讯文本进行风险评级;S3.抽取数据流中资讯文本事件中的涉事主体;S4.根据所述涉事主体的相关信息,到构建的知识图谱中查询,获取该涉事主体的详细属性,同时识别风险通过该涉事主体可能扩散到的关联主体;S5.基于所述关联主体,计算其与所述涉事主体的关系强度,再结合风险等级,分析关联主体受风险传播的影响程度,得到关联风险评分;S6.将计算得出的高风险主体、关联主体以及关联风险评分发出进行相关业务提醒。
技术领域
本发明涉及负面舆情预警以及风险传播领域,尤其涉及一种用在金融行业的基于知识图谱的实时负面舆情预警以及风险传播分析方法、系统、设备及存储介质。
背景技术
当前,为了应对市场风险,各大金融机构都会对各类新闻公告进行实时监控,对于其中负面舆情所涉及的公司或个人进行相应的重新评级和经营策略调整。这项任务通常都是由风险部门专业人员进行评估,但是需要整合处理的信息量巨大,几乎不可能短时间内找出所有可能的风险传播途径,因此人工预警缺乏实时性和全面性。
对新闻公告这类文本数据的风险评级属于自然语言处理(Natural LanguageProcessing,NLP)领域内最普遍的任务--文本分类。相关技术不断在迭代,从一开始的关键词词频统计到TF-IDF,再到SVM等机器学习方法。随着深度学习(Deep Learning)技术在不同研究领域获得突破,许多行业开始尝试采用该技术去学习数据的表示方式,发掘内在规律。
新闻公告数据中蕴含了很多实时信息,然而由于其非结构化的特点,导致计算机很难有效地使用。命名实体识别(Named Entity Recognition,NER)技术能够从非结构化文本中抽取出所需要的实体类型,比如人名、地名和组织机构名等,属于NLP领域的典型问题。抽取出的字段信息能够用于生成计算机可自动化处理的结构化文件。
如果说深度学习增强了计算机的感知能力,那么知识图谱(Knowledge Graph)则是增强了认知能力。知识图谱起源于上个世纪50年代,从引文网络开始到语义网,期间不断扩充和发展,吸收了哲学范畴中的“本体”概念用于知识组织和表达,逐渐使自然世界中的知识更易于计算机存储、加工和交互。知识图谱不仅仅是一个用三元组构建的图数据模型,它还包含了知识获取、知识表示、知识存储、知识融合、知识推理与挖掘等一系列技术。可以将多源异质的数据通过知识整合起来使得人工智能技术更贴合常识、更具可解释性。
图数据库能够作为知识图谱的载体,然而真实的图或者关系网络通常十分高维,难以计算。图嵌入(Graph Embedding)技术能够将图结构进行降维,根据实际情况构造低维向量空间,利用图嵌入算法将图的节点映射到该空间中。之后再进行图计算,只需很低的时间和空间复杂度。
上述现有技术存在以下缺陷:
1.文本分类预训练模型虽然不需要大量数据也能获得高准确度,但是比较“笨重”,模型体积大,计算占用资源多,比较耗时;而如果采用轻量模型,则需要大量的标注数据从零开始训练模型。
2.文本分类以及命名实体抽取算法都可以很好地代替人工,对负面舆情进行分类评级并从文章中找出事件的主体,从而量化该舆情对涉事主体的影响程度。然而,大多数情况下,风险分析人员除了需要了解该主体的风险级别之外,还需要知道舆情影响扩散之后,除涉事主体外,其他相关主体受影响的程度以及传播方式。
3.知识图谱可以很好地查询和展示出主体的直接关系(一度关系)和间接关系(二度关系),但是很难找出没有联系却包含隐式关系的主体。比如,A、B企业具有类似的上下游供应商:C1→A→D1,C2→B→D2,C1、D1分别与C2、D2具有相似属性,B其实与A存在隐性的相似关系。如果某个负面舆情对A这类企业产生了影响,对C1、D1产生的影响可以通过查找知识图谱的实体关系得知,而对B产生的影响却无法挖掘到。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中信银行股份有限公司,未经中信银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010021613.9/2.html,转载请声明来源钻瓜专利网。