[发明专利]用于企业风险预警的舆情分析方法及系统在审
申请号: | 202011264306.X | 申请日: | 2020-11-12 |
公开(公告)号: | CN113297283A | 公开(公告)日: | 2021-08-24 |
发明(设计)人: | 李加庆 | 申请(专利权)人: | 苏宁金融科技(南京)有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F40/289;G06F40/295;G06K9/62;G06N3/04;G06N3/08;G06Q10/06 |
代理公司: | 北京市万慧达律师事务所 11111 | 代理人: | 盛安平 |
地址: | 211800 江苏省南京市江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 企业 风险 预警 舆情 分析 方法 系统 | ||
1.一种用于企业风险预警的舆情分析方法,其特征在于,包括:
从任一指定网站中采集舆情文本数据,并针对所述舆情文本数据的网站来源构建数据源序列;
基于预设的风险标签集对所述舆情文本数据的风险标签进行匹配,并构建风险标签序列;
利用情感分类模型对所述舆情文本数据进行情感极性的分类构建情感极性序列,以及对所述舆情文本数据中关联的企业实体名称进行识别构建企业关联序列;
根据所述舆情文本数据对应的数据源序列、风险标签序列、情感极性序列和企业关联序列,计算输出舆情分析结果。
2.根据权利要求1所述的方法,其特征在于,针对所述舆情文本数据的网站来源构建数据源序列的方法包括:
统计指定网站的总数量并配置各指定网站的信用权重,构建与总数量维度一致的数据源序列集;
识别来源网站在数据源序列集中的位置,构建对应的数据源序列同时匹配对应的信用权重。
3.根据权利要求1所述的方法,其特征在于,基于预设的风险标签集对所述舆情文本数据的风险标签进行匹配之前还包括:
预先构建风险标签集,所述风险标签集包括多个风险标签类别,且每个风险标签类别对应至少一个风险关键词;
针对风险标签集中的各风险标签类别配置相应的风险权重。
4.根据权利要求3所述的方法,其特征在于,基于预设的风险标签集对所述舆情文本数据的风险标签进行匹配,并构建风险标签序列的方法包括:
采用文本关键词匹配的方式对所述舆情文本数据进行风险关键词的匹配,并根据匹配结果查找对应的风险标签类别;
基于所述风险标签类别在风险标签集中的所属位置,构建风险标签序列。
5.根据权利要求1所述的方法,其特征在于,情感分类模型的训练方法包括:
从获取的舆情语料中分别抽取各种情感极性的舆情语料,构建标注语料集;
基于标注语料集采用LSTM或者TextCNN模型架构训练情感分类模型;
所述情感极性的分类包括积极情感、中性情感和消极情感,所述情感极性序列为3种情感极性之一的序列表示。
6.根据权利要求5所述的方法,其特征在于,利用情感分类模型对所述舆情文本数据进行情感极性的分类构建情感极性序列之后还包括:
针对每种情感极性配置相应的极性权重。
7.根据权利要求1所述的方法,其特征在于,对所述舆情文本数据中关联的企业实体名称进行识别构建企业关联序列的方法包括:
预先构建包括多个企业实体的企业监控列表;
结合中文分词工具和/或NER命名实体识别工具采用关键词匹配的方式识别出所述舆情文本数据关联的企业实体名称;
基于企业实体名在企业监控列表中的所属位置,构建企业关联序列。
8.根据权利要求1所述的方法,其特征在于,根据所述舆情文本数据对应的数据源序列、风险标签序列、情感极性序列和企业关联序列,计算输出舆情分析结果之前还包括:
预先设定多种风险预警等级,同时定义每种风险预警等级的边界区间。
9.根据权利要求8所述的方法,其特征在于,根据所述舆情文本数据对应的数据源序列、风险标签序列、情感极性序列和企业关联序列,计算输出舆情分析结果的方法包括:
采用舆情风险预警公式对所述舆情文本数据的风险值进行计算;
结合企业关联序列计算所述舆情文本数据对应的预警值,并基于所属的边界区间输出相应的风险预警等级;
所述Ri表示对应风险标签类别的风险权重,所述Li表示风险标签序列,所述n表示风险标签集中风险标签类别的总数量,所述Wi表示指定网站的信用权重,所述Si表示数据源序列,所述k表示指定网站的总数量,所述Qi表示极性权重,所述Ti表示情感极性序列,所述p表示情感极性的总数量。
10.一种用于企业风险预警的舆情分析系统,其特征在于,包括:
舆情采集模块,用于从任一指定网站中采集舆情文本数据,并针对所述舆情文本数据的网站来源构建数据源序列;
风险标签模块,用于基于预设的风险标签集对所述舆情文本数据的风险标签进行匹配,并构建风险标签序列;
情感极性及实体名称识别模块,用于利用情感分类模型对所述舆情文本数据进行情感极性的分类构建情感极性序列,以及对所述舆情文本数据中关联的企业实体名称进行识别构建企业关联序列;
预警输出模块,用于根据所述舆情文本数据对应的数据源序列、风险标签序列、情感极性序列和企业关联序列,计算输出舆情分析结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏宁金融科技(南京)有限公司,未经苏宁金融科技(南京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011264306.X/1.html,转载请声明来源钻瓜专利网。