[发明专利]一种面向证券行业的智能舆情监控方法及系统在审
申请号: | 201910170344.X | 申请日: | 2019-03-05 |
公开(公告)号: | CN109992661A | 公开(公告)日: | 2019-07-09 |
发明(设计)人: | 王超;张岩;冯海涵;叶秋彬;蒋荣;叶鹏;丁里;李衡;樊兴 | 申请(专利权)人: | 广发证券股份有限公司;广发证券资产管理(广东)有限公司 |
主分类号: | G06F16/34 | 分类号: | G06F16/34;G06F16/953;G06F17/27;G06K9/62 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 颜希文;麦小婵 |
地址: | 510663 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 事件标签 情感标签 舆情信息 证券行业 主体信息 三元组 监控 标签 情感分类 融合算法 事件分类 事件识别 系统分类 摘要提取 主体识别 智能 多维度 准确率 去重 算法 维度 采集 发行 | ||
1.一种面向证券行业的智能舆情监控方法,其特征在于,包括如下步骤:
采集面向证券行业内发行主体维度的新闻舆情数据,并进行数据去重处理,得到新闻舆情信息;
对所述新闻舆情信息进行摘要提取以及情感分类,分别生成篇章摘要和对应的篇章情感标签,并对所述新闻舆情数据进行主体识别,得到对应的主体信息;
基于金融行业的专业词典对所述主体信息进行主体行业及地区识别,得到对应的主体行业标签和主体地区标签;
根据事件标签体系和事件分类算法对所述主体信息进行主体事件识别,得到主体事件标签及其对应的情感标签;
根据所述主体信息、主体事件标签及其对应的情感标签组成三元组,并将所有主体对应的三元组进行汇总,生成篇章级别的三元组。
2.根据权利要求1所述的面向证券行业的智能舆情监控方法,其特征在于,还包括:
根据所述篇章级别的三元组,通过匹配用户的关注点,进行舆情分类检索、舆情预警推送和舆情趋势分析。
3.根据权利要求1所述的面向证券行业的智能舆情监控方法,其特征在于,所述情感标签包括正面、中性和负面。
4.根据权利要求1所述的面向证券行业的智能舆情监控方法,其特征在于,所述事件分类算法还包括双向编码算法、逻辑回归算法、支持向量机算法、全文搜索引擎以及规则算法。
5.根据权利要求1所述的面向证券行业的智能舆情监控方法,其特征在于,所述主体事件识别,具体步骤包括:
对新闻主体和主体信息进行文本切词处理,得到对应的词向量、单词组、双词组和三词组;
根据所述双向编码算法对所述词向量进行计算,根据所述逻辑回归算法、支持向量机算法和全文搜索引擎对所述单词组、双词组、三词组进行计算,得到对应的事件标签;
根据所述规则算法与全文搜索引擎进行结合,召回与当前文本相似的已标注文本,其对应的事件标签作为当前文本事件标签的候选集,进一步过滤其他算法识别出的事件标签。
6.根据权利要求1所述的面向证券行业的智能舆情监控方法,其特征在于,所述事件标签体系包括9个一级事件标签、59个二级事件标签、213个三级事件标签和102个四级事件标签。
7.一种面向证券行业的智能舆情监控系统,其特征在于,包括:
采集模块,用于采集面向证券行业内发行主体维度的新闻舆情数据,并进行数据去重处理,得到新闻舆情信息;
预处理模块,用于对所述新闻舆情信息进行摘要提取以及情感分类,分别生成篇章摘要和对应的篇章情感标签,并对所述新闻舆情数据进行主体识别,得到对应的主体信息;
识别模块,用于基于金融行业的专业词典对所述主体信息进行主体行业及地区识别,得到对应的主体行业标签和主体地区标签;
分类模块,用于根据事件标签体系和事件分类算法对所述主体信息进行主体事件识别,得到主体事件标签及其对应的情感标签;
汇总模块,用于根据所述主体信息、主体事件标签及其对应的情感标签组成三元组,并将所有主体对应的三元组进行汇总,生成篇章级别的三元组。
8.根据权利要求7所述的面向证券行业的智能舆情监控系统,其特征在于,还包括:
应用模块,用于根据所述篇章级别的三元组,通过匹配用户的关注点,进行舆情分类检索、舆情预警推送和舆情趋势分析。
9.根据权利要求7所述的面向证券行业的智能舆情监控系统,其特征在于,所述事件分类算法还包括双向编码算法、逻辑回归算法、支持向量机算法、全文搜索引擎以及规则算法。
10.根据权利要求7所述的面向证券行业的智能舆情监控系统,其特征在于,所述主体事件识别,具体步骤包括:
对新闻主体和主体信息进行文本切词处理,得到对应的词向量、单词组、双词组和三词组;
根据所述双向编码算法对所述词向量进行计算,根据所述逻辑回归算法、支持向量机算法和全文搜索引擎对所述单词组、双词组、三词组进行计算,得到对应的事件标签;
根据所述规则算法与全文搜索引擎进行结合,召回与当前文本相似的已标注文本,其对应的事件标签作为当前文本事件标签的候选集,进一步过滤其他算法识别出的事件标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广发证券股份有限公司;广发证券资产管理(广东)有限公司,未经广发证券股份有限公司;广发证券资产管理(广东)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910170344.X/1.html,转载请声明来源钻瓜专利网。