[发明专利]企业舆情分析方法、装置、电子设备及介质有效
申请号: | 202010354452.5 | 申请日: | 2020-04-29 |
公开(公告)号: | CN111695033B | 公开(公告)日: | 2023-06-27 |
发明(设计)人: | 周欣欣;李文;吴晓贝;于修铭;汪伟 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/951;G06F40/216;G06F40/289;G06F40/30;G06V30/14;G06V30/19;G06V10/82;G06N3/0464;G06N3/0455;G06N3/0442;G06N3/048;G06N3/08 |
代理公司: | 深圳市赛恩倍吉知识产权代理有限公司 44334 | 代理人: | 刘丽华;孙芬 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 企业 舆情 分析 方法 装置 电子设备 介质 | ||
1.一种企业舆情分析方法,其特征在于,所述企业舆情分析方法包括:
从预设的数据渠道获取舆情文本;
对获取到的舆情文本进行预处理,得到每个舆情文本的多个词组;
对每个舆情文本的多个词组进行命名实体识别,并将识别到企业实体的舆情文本确定为目标文本;
基于依存句法分析技术,对所述目标文本进行主体识别,得到识别结果,包括:根据依存句法分析技术,获取所述目标文本中每个文本语句的核心动词;确定与所述核心动词依存关系为主谓关系和动宾关系的分词;计算所述目标文本中所述分词的总数量;获取所述企业实体对应的目标分词,并计算所述目标分词在所述目标文本中的目标数量;将所述目标数量除以所述总数量,得到目标比例;当检测到所述目标比例大于第一预设比例时,将所述目标分词确定为所述目标文本的主体,作为所述识别结果,或者当检测到所述目标比例小于第二预设比例时,将所述目标分词确定为所述目标文本的提及,作为所述识别结果,并按照预设的分类标准对所述目标文本进行分类,得到分类结果;
将所述目标文本、所述识别结果及所述分类结果输入至预先训练好的情感模型中,得到情感结果;
选取出情感结果为负面情绪的目标文本,作为预警文本;
将所述预警文本与配置列表中的预警词组进行匹配,并将匹配到的预警词组确定为所述预警文本的预警类别;
获取所述预警文本的目标企业,并根据所述预警类别及所述预警文本生成所述目标企业的预警信息。
2.如权利要求1所述的企业舆情分析方法,其特征在于,所述对每个舆情文本的多个词组进行命名实体识别,并将识别到企业实体的舆情文本确定为目标文本包括:
对每个舆情文本的多个词组进行向量化处理,得到每个舆情文本的输入向量序列;
将每个舆情文本的输入向量序列输入到NER模型中,并获取激活层中每个序列位置上对应的每个标签的输出概率及转移概率;
对于每个序列位置,对每个标签的输出概率及转移概率进行加权和运算,得到每个标签的数值;
将数值最高的标签确定为每个序列位置上的输出标签,并组合每个序列位置上的输出标签,得到每个舆情文本的实体列表;
当检测到实体列表中含有一个企业实体时,将该实体列表对应的舆情文本确定为所述目标文本;或者
当检测到实体列表中含有多个企业实体时,将该实体列表对应的舆情文本确定为多文本,依照所述多个企业实体拆分所述多文本,得到所述目标文本。
3.如权利要求2所述的企业舆情分析方法,其特征在于,所述对每个舆情文本的多个词组进行向量化处理,得到每个舆情文本的输入向量序列包括:
根据预设编码表获取每个舆情文本的每个词组的编码向量;
根据每个舆情文本的每个词组的位置编号生成每个词组的位置向量;
拼接每个词组的编码向量及每个词组的位置向量,得到每个词组的目标向量;
依照词序组合每个舆情文本的每个词组的目标向量,得到每个舆情文本的输入向量序列。
4.如权利要求2所述的企业舆情分析方法,其特征在于,在将每个舆情文本的输入向量序列输入到NER模型之前,所述方法还包括:
获取企业舆情数据,并根据所述企业舆情数据选取目标标注模式;
将所述目标标注模式添加至组合模型中,得到标注模型;
对所述标注模型进行裁剪,获得裁剪模型;
对所述裁剪模型进行降阶,获得所述NER模型。
5.如权利要求4所述的企业舆情分析方法,其特征在于,所述对所述标注模型进行裁剪,获得裁剪模型包括:
从所述标注模型中提取所有卷积核;
利用灰色关联分析方法对所述所有卷积核中每个卷积核进行重要度的量化,得到每个卷积核的重要度的量化值;
将所述所有卷积核按照所述量化值的大小依照从小至大的顺序进行排序,得到队列;
从所述队列中选取前N个卷积核,作为目标卷积核,所述N为正整数;
删除所述标注模型中的目标卷积核,得到所述裁剪模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010354452.5/1.html,转载请声明来源钻瓜专利网。