[发明专利]基于树模型的事件影响度获取方法、装置及计算机设备有效
申请号: | 202110737088.5 | 申请日: | 2021-06-30 |
公开(公告)号: | CN113190682B | 公开(公告)日: | 2021-09-28 |
发明(设计)人: | 周骏红;陈一峰;彭琛 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/335;G06F16/338;G06F40/216;G06F40/295;G06F40/30;G06K9/62;G06N3/08;H04L29/08 |
代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 李翔宇 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 模型 事件 影响 获取 方法 装置 计算机 设备 | ||
1.一种基于树模型的事件影响度获取方法,其特征在于,包括:
若检测到文本数据,通过对所述文本数据进行事件类型分类,得到与所述文本数据对应的事件分类结果;
获取所述文本数据所相应的文本发送方,在确定所述文本发送方的可信度超出预设的可信度阈值时,获取所述文本数据对应的事件分类结果,并获取所述文本数据所对应相关公司主体名称的公司基本面数据,由所述事件分类结果和所述公司基本面数据组成得到事件核心数据集;其中,所述公司基本面数据包括公司财务指标值和公司估值指标值;
调用已训练的随机森林模型,将所述事件核心数据集输入至所述随机森林模型中,得到与所述事件核心数据集对应的事件影响度参数,并将所述事件核心数据集对应的事件影响度参数存储至本地;
在确定未检测到另一文本数据时,获取本地已存储的未推送文本数据集,以及所述未推送文本数据集中每一个未推送文本数据对应的事件影响度参数;其中,所述未推送文本数据集对应的事件相关公司主体名称与所述文本数据对应的事件相关公司主体名称相同;
将所述文本数据对应的事件影响度参数及所述未推送文本数据集中每一个未推送文本数据对应的事件影响度参数根据预设的排序策略进行影响度参数排序,得到排序结果;以及
获取所述排序结果中排名值未超出预设的排名阈值的各事件影响度参数分别对应的文本数据,组成待推送文本数据集;
所述通过对所述文本数据进行事件类型分类,得到与所述文本数据对应的事件分类结果,包括:
获取所述文本数据对应的来源类型,判断所述文本数据对应的来源类型是企业新闻舆情文本或者是企业公告文本;
若所述文本数据对应的来源类型对应的是企业新闻舆情文本,通过信息抽取获取所述文本数据对应的事件核心信息集;其中,所述事件核心信息集中至少包括事件相关公司主体名称、事件内容关键词集、事件发生时间、事件相关人员清单、文本数据来源信息;
调用预先训练的事件分类模型,将所述事件核心信息集输入至所述事件分类模型中,得到与所述文本数据对应的事件分类结果;
若所述文本数据对应的来源类型对应的是企业公告文本,通过获取所述企业公告文本的标题、正文文本和表格信息,得到与所述文本数据对应的事件分类结果。
2.根据权利要求1所述的基于树模型的事件影响度获取方法,其特征在于,所述通过信息抽取获取所述文本数据对应的事件核心信息集,包括:
通过实体抽取获取所述文本数据对应的实体识别结果;
通过关系抽取在所述文本数据中获取所述实体识别结果中各实体之间的关系,得到三元组提取结果;
通过事件抽取在所述文本数据中获取所述实体识别结果中各实体之间的多元关系,得到事件抽取结果;
由所述实体识别结果、三元组提取结果及事件抽取结果组成事件核心信息集。
3.根据权利要求1所述的基于树模型的事件影响度获取方法,其特征在于,所述将所述事件核心信息集输入至所述事件分类模型中,得到与所述文本数据对应的事件分类结果,包括:
获取所述事件核心信息集中的事件内容关键词集,由事件内容关键词集对应的各事件内容关键词的词向量进行加权运算,获取与所述事件内容关键词集对应的事件语义向量;
将所述事件语义向量输入至所调用的事件分类模型进行运算,得到与所述文本数据对应的事件分类结果。
4.根据权利要求1所述的基于树模型的事件影响度获取方法,其特征在于,所述调用已训练的随机森林模型,将所述事件核心数据集输入至所述随机森林模型中,得到与所述事件核心数据集对应的事件影响度参数,并将所述事件核心数据集对应的事件影响度参数存储至本地之前,还包括:
获取历史事件核心数据集及对应的历史事件影响度参数组成原始训练集,通过原始训练集对待训练的随机森林模型进行模型训练,得到随机森林模型。
5.根据权利要求1所述的基于树模型的事件影响度获取方法,其特征在于,还包括:
若检测到另一文本数据,将另一文本数据更新为文本数据,返回执行所述若检测到文本数据,通过对所述文本数据进行事件类型分类,得到与所述文本数据对应的事件分类结果的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110737088.5/1.html,转载请声明来源钻瓜专利网。