[发明专利]基于知识图谱的银行舆情分析方法和系统在审
申请号: | 202010717090.1 | 申请日: | 2020-07-23 |
公开(公告)号: | CN111881302A | 公开(公告)日: | 2020-11-03 |
发明(设计)人: | 李振;刘恒;赵兴莹;李勇辉;李毓瑞;吴梅;秦培歌;张泽 | 申请(专利权)人: | 民生科技有限责任公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/34 |
代理公司: | 北京金智普华知识产权代理有限公司 11401 | 代理人: | 巴晓艳 |
地址: | 101300 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 知识 图谱 银行 舆情 分析 方法 系统 | ||
本发明公开了一种基于知识图谱的银行舆情分析方法和系统,涉及信息安全技术领域。该方法包括:从各种搜索引擎中抓取针对待分析主体的原始数据,对原始数据进行预处理,得到舆情数据并存放在数据库中,并生成热词情感表;根据数据库中的舆情数据并结合热词情感表构建热词知识图谱、舆情来源知识图谱和负面舆情知识图谱;根据所建立的热词知识图谱、舆情来源知识图谱和负面舆情知识图谱进行舆情分析。本发明提供的银行舆情分析方法是基于知识图谱的,一方面基于知识图谱将银行的相关舆情进行可视化,另一方面基于图谱利用一些算法挖掘其中的重要知识,可以快速的获取相关信息并作出相关决策。
技术领域
本发明涉及信息安全技术领域,具体涉及一种基于知识图谱的银行舆情分析方法和系统。
背景技术
当下银行所服务的客户群体庞大、覆盖范围又广,所以银行舆情突发率极高,并且银行舆情事件发生后往往都能引发舆论热议。所以,在银行舆情事件突发后,若不能及时加以处理,化解银行舆情风险,其给银行机构造成的损失是极大的。同时由于银行服务网点多,客户群体庞大,所以其舆情监测量大,仅依靠人工在网络上通过搜索关键词进行监测,舆情发现及处置较为滞后,不具备即时性。
发明内容
为了解决以上问题,也为了做到舆情早发现,本发明提出了基于知识图谱的银行舆情分析方法和系统,从而提供一种高效的、直观的银行舆情分析的方法。本发明提供的银行舆情分析方法是基于知识图谱的,一方面基于知识图谱将银行的相关舆情进行可视化,另一方面基于图谱利用一些算法挖掘其中的重要知识,可以快速的获取相关信息并作出相关决策。
根据本发明的第一方面,提供一种基于知识图谱的银行舆情分析方法,所述方法包括:
舆情数据获取采集步骤:从各种搜索引擎中抓取针对待分析主体的原始数据,对原始数据进行预处理,得到舆情数据并存放在数据库中,并生成热词情感表;
舆情知识图谱构建步骤:根据数据库中的舆情数据构建第一知识图谱、第二知识图谱和第三知识图谱;
舆情分析步骤:根据所建立的第一知识图谱、第二知识图谱和第三知识图谱进行舆情分析。
进一步的,所述原始数据包括但不限于:新闻标题、新闻正文、新闻摘要、新闻发布日期、新闻来源数据。
进一步的,所述对原始数据进行预处理包括但不限于:对原始数据进行清洗、删除重复数据和无关内容、数据标准化、实体消歧操作、命名实体识别、实体关系抽取以及确定三元组结构。
进一步的,所述第一知识图谱为热词知识图谱。
进一步的,所述热词知识图谱的构建包括以下步骤:
步骤1:根据数据库中的舆情数据,针对待分析主体创建待分析主体信息表,并根据热词情感表选取待分析主体再所选时间范围内排名前十的一级热词及其对应的二级热词;
步骤2:生成待分析主体与一级热词的关系表,以及一级热词与二级热词的关系表;
步骤3:根据步骤1的结果,创建待分析主体节点、一级热词节点以及二级热词节点;
步骤4:根据步骤2的结果,创建待分析主体与一级热词的关系、一级热词与二级热词的关系;
步骤5:完成构建热词知识图谱。
进一步的,所述第二知识图谱为舆情来源知识图谱。
进一步的,所述舆情来源知识图谱的构建包括以下步骤:
步骤1:根据数据库中的舆情数据,创建待分析主体信息表、正负面信息表、舆情新闻来源信息表、舆情新闻来源分类信息表和新闻事件类型信息表;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于民生科技有限责任公司,未经民生科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010717090.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:具有变角全向轮的全向车
- 下一篇:一种基于压缩感知算法的自适应稀疏预失真结构