[发明专利]利用大数据的证券研报情感分析方法、装置及计算机设备在审
申请号: | 201811228240.1 | 申请日: | 2018-10-22 |
公开(公告)号: | CN109460550A | 公开(公告)日: | 2019-03-12 |
发明(设计)人: | 叶曙峰;蒋逸文;孙葛亮;刘琼 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06Q40/06 |
代理公司: | 北京英特普罗知识产权代理有限公司 11015 | 代理人: | 林彦之 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 情感分析 证券 分句 分词 大数据 分析 情感词典 情感类型 准确率 预测 预置评分规则 计算机设备 比对结果 接收输入 智能化 预设 | ||
1.一种利用大数据的证券研报情感分析方法,其特征在于,包括如下步骤:
S01,接收输入的待分析证券研报;
S02,对待分析证券研报进行分句处理,得到待分析证券研报中的各分句;
S03,对待分析证券研报中的各分句进行分词处理,得到待分析证券研报中的各分词;
S04,基于待分析证券研报中的各分词,利用预先建立的情感词典确定待分析证券研报中的预测类分句;
S05,根据所述情感词典确定待分析证券研报中的预测类分句中各分词的情感类型;
S06,基于待分析证券研报中的预测类分句中各分词的情感类型,利用预置评分规则对待分析证券研报中的各预测类分句进行评分;
S07,基于待分析证券研报中的各预测类分句的评分,计算得到待分析证券研报的整体情感分数;
S08,将待分析证券研报的整体情感分数与预设分数阈值进行比对,并根据比对结果获取待分析证券研报的情感分析结果。
2.根据权利要求1所述的利用大数据的证券研报情感分析方法,其特征在于,建立所述情感词典,包括如下步骤:
步骤110,对预置篇数的证券研报进行分句处理,得到证券研报中的各第一分句;
步骤120,对各第一分句进行分词处理,得到证券研报中的各第一分词;
步骤130,从所有第一分词中提取用于表达正面情感的分词、用于表达负面情感的分词、用于表达否定情感的分词及用于表达预测的分词;
步骤140,根据提取结果分别生成正面情感词库、负面情感词库、否定情感词库及预测类词库;
步骤150,基于正面情感词库、负面情感词库、否定情感词库及预测类词库建立所述情感词典。
3.根据权利要求2所述的利用大数据的证券研报情感分析方法,其特征在于,S04基于待分析证券研报中的各分词,利用预先建立的情感词典确定待分析证券研报中的预测类分句,包括:
将待分析证券研报中的各分词与所述情感词典中预测类词库中的分词进行匹配;
若待分析证券研报中的任一分词能够与所述情感词典中预测类词库中的分词相匹配,则将该任一分词所属的分句确定为预测类分句。
4.根据权利要求2所述的利用大数据的证券研报情感分析方法,其特征在于,S05根据所述情感词典确定待分析证券研报中的预测类分句中各分词的情感类型,包括:
将待分析证券研报中的预测类分句中的各分词分别与所述情感词典中正面情感词库、负面情感词库、否定情感词库中的分词进行匹配;
若待分析证券研报中的任一分词能够与正面情感词库、负面情感词库或者否定情感词库中的分词相匹配,则将该任一分词的情感类型确定为正面分词、负面分词或者否定分词。
5.根据权利要求4所述的证券研报的情感分析利用大数据的证券研报情感分析方法,其特征在于,S06基于待分析证券研报中的预测类分句中各分词的情感类型,利用预置评分规则对待分析证券研报中的各预测类分句进行评分,包括:
统计待分析证券研报中每个预测类分句中的正面分词、负面分词的初始数量及否定分词的数量;
判断否定分词的数量是否为奇数;
若是,则判断奇数个否定分词前面或后面相邻的是正面分词还是负面分词;
若奇数个否定分词前面或后面相邻的是正面分词,则将正面分词的初始数量减一并将负面分词的初始数量加一,以分别作为调整后的正面分词数量及负面分词数量;若奇数个否定分词前面或后面相邻的是负面分词,则将负面分词的初始数量减一并将正面分词的初始数量加一,以分别作为调整后的负面分词数量及正面分词数量;
将待分析证券研报中的各预测类分句中正面分词数量与负面分词数量的差除以正面分词数量与负面分词数量的和,以得到待分析证券研报中的各预测类分句的评分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811228240.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:语义向量的处理方法及装置
- 下一篇:签名信息提取方法及装置