[发明专利]一种涉及金融投研的数据处理方法及终端有效
申请号: | 202010950256.4 | 申请日: | 2020-09-11 |
公开(公告)号: | CN111815426B | 公开(公告)日: | 2020-12-15 |
发明(设计)人: | 李伟;杨双 | 申请(专利权)人: | 深圳司南数据服务有限公司 |
主分类号: | G06Q40/00 | 分类号: | G06Q40/00;G06F16/35;G06F16/36;G06N3/04;G06N3/08 |
代理公司: | 深圳市博锐专利事务所 44275 | 代理人: | 欧阳燕明 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 涉及 金融 数据处理 方法 终端 | ||
本发明提供了一种涉及金融投研的数据处理方法及终端,获取资讯来源、资讯标题、资讯文本及主观性词典,将资讯标题及资讯文本拆分为有顺序的句子序列;根据资讯来源得到来源特征向量,根据句子序列得到其中每一个句子的句子特征向量,根据句子序列及主观性词典得到每一个句子的主观权重得分及主观性得分;根据来源特征向量、句子特征向量、主观权重得分及主观性得分,得到资讯特征向量;根据资讯特征向量,使用逻辑回归判断标签类型,标签类型为主观或客观;本发明不仅考虑到资讯正文的文本内容,也将资讯的来源考虑进主客观的分析中,最终使用逻辑回归判断资讯的主客观,计算简单,基于词语的模型训练和分析确保了对资讯内容分析结果的准确性。
技术领域
本发明涉及数据分析领域,尤其涉及一种涉及金融投研的数据处理方法及终端。
背景技术
随着人工智能、大数据、云计算和区块链等新型互联网技术的发展,金融行业也正在发生着巨大的变化,以人工智能为代表的新技术与金融服务、产品的深度融合产生了智能金融的概念,而智能投研就是智能金融的服务场景之一。
投研的前期分析需要对行业内的各种资讯进行总结和筛选,提取其中的关键信息生成摘要以供后续分析判断使用,并且,因为资讯是人工撰写的,为了避免其中的主观结论影响后期对信息的提取与分析,往往需要对其进行主客观分析,对其中的主观描述进行修改,并且,对于最终生成的研究报告,也需要检查其中的描述,摒弃主观性的描述,但是传统并未有相应技术能够实现对文本的分析,故都需要依靠人工进行排查,效率低且容易出现遗漏的情况;
现有的方案(申请公布号CN110750648A一种基于深度学习和特征融合的文本情感分类方法),该方案主要是通过整合层次特征学习文本表示,其中里面包含了使用层级结构的深度学习模型来提取句子特征和文档特征,最终用随机森林进行情感分类,但其需要表情符号的辅助,适用于社交网络上的文本分析,而对于资讯类文稿此种方式的判断准确率较低。
发明内容
本发明所要解决的技术问题是:提供一种涉及金融投研的数据处理方法及终端,能够准确区分出资讯文本中的主客观内容。
为了解决上述技术问题,本发明采用的一种技术方案为:
一种涉及金融投研的数据处理方法,包括步骤:
S1、获取资讯来源、资讯标题、资讯文本及主观性词典,并将所述资讯标题及所述资讯文本拆分为有顺序的句子序列;
S2、根据所述资讯来源得到来源特征向量,根据所述句子序列得到所述句子序列中每一个句子的句子特征向量,根据所述句子序列及所述主观性词典得到每一个句子的主观权重得分及主观性得分;
S3、根据所述来源特征向量、所述句子特征向量、所述主观权重得分及所述主观性得分,得到资讯特征向量;
S4、根据所述资讯特征向量,使用逻辑回归判断标签类型,所述标签类型为主观或客观。
为了解决上述技术问题,本发明采用的另一种技术方案为:
一种涉及金融投研的数据处理终端,包括存储器、处理器及存储在存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
S1、获取资讯来源、资讯标题、资讯文本及主观性词典,并将所述资讯标题及所述资讯文本拆分为有顺序的句子序列;
S2、根据所述资讯来源得到来源特征向量,根据所述句子序列得到所述句子序列中每一个句子的句子特征向量,根据所述句子序列及所述主观性词典得到每一个句子的主观权重得分及主观性得分;
S3、根据所述来源特征向量、所述句子特征向量、所述主观权重得分及所述主观性得分,得到资讯特征向量;
S4、根据所述资讯特征向量,使用逻辑回归判断标签类型,所述标签类型为主观或客观。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳司南数据服务有限公司,未经深圳司南数据服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010950256.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:半导体封装结构和封装方法
- 下一篇:一种基于自然语言生成结构化查询语句的方法