[发明专利]信息分类抽取方法、装置、计算机设备和存储介质有效
申请号: | 201910844517.1 | 申请日: | 2019-09-06 |
公开(公告)号: | CN110765265B | 公开(公告)日: | 2023-04-11 |
发明(设计)人: | 刘康龙;徐国强 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/31;G06F40/211;G06F40/289;G06F40/30 |
代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 杨欢 |
地址: | 518033 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息 分类 抽取 方法 装置 计算机 设备 存储 介质 | ||
1.一种信息分类抽取方法,所述方法包括:
获取待分类信息;
对待分类信息进行分词处理,得到多个文本块;
将所述多个文本块输入至已训练的分类器,对多个文本块进行分类,确定所述待分类信息的目标事件类别和多个事件元素;
根据所述目标事件类别和事件元素提取对应的事件元素参数,并输出所述目标事件类别和多个事件元素以及相应的事件元素参数;
根据所述多个事件元素和相应的事件元素参数生成所述目标事件类别对应的事件图谱数据;
所述分类器包括多个网络层,所述对多个文本块进行分类的步骤包括:
将所述多个文本块输入至所述分类器,通过所述分类器的输入层提取出多个文本块对应的文本向量;
将多个文本向量作为关系分析网络层的输入,通过所述关系分析网络层对多个文本向量进行特征识别,提取文本向量的上下文特征,得到第一提取结果;
将所述第一提取结果作为图卷积网络层的输入,通过所述图卷积网络层将文本向量转换为句法图结构,根据所述句法图结构提取多个文本向量的依赖关系,得到第二提取结果;
将所述第二提取结果作为自注意力网络层的输入,根据文本向量的上下文特征和依赖关系分析多个事件元素的关联关系和权重,生成第三提取结果;
将所述第三提取结果输入至分类层,通过所述分类层对所述第三提取结果进行分类得到对应的事件类别,以及多个事件元素和相应的事件元素参数,生成分类结果,通过输出层对分类结果进行加权后输出。
2.根据权利要求1所述的方法,其特征在于,所述待分类信息包括标题信息,所述对待分类信息进行分词处理的步骤包括:
根据所述标题信息匹配获取对应的定义表;
根据所述定义表对所述待分类信息进行词性标注,并根据词性标签进行分词,得到多个文本块;
根据分词后的多个文本块的词性标签对多个文本块标记优先等级;
删除所述优先等级未达到预设等级值的文本块,利用优先等级达到预设等级值的文本块得到过滤后的文本块。
3.根据权利要求1所述的方法,其特征在于,所述通过所述图卷积网络层将文本向量转换为句法图结构,根据所述句法图结构提取文本向量的依赖关系的步骤,包括:
根据所述多个文本向量生成相应的多个文本块节点,并将多个文本块节点转换为相应的多个图节点;
通过所述图卷积网络层中的依赖性解析树解析出多个图节点对应的快捷弧表示;
通过所述图卷积网络层的图形轮廓网络分析多个图节点的语义特征和语境特征;
根据多个图节点的快捷弧表示和语义特征以及语境特征分析出多个文本向量的依赖关系。
4.根据权利要求1所述的方法,其特征在于,在对多个文本块进行分类之前,还包括:
获取多个样本数据,将所述样本数据分为训练集和验证集;
获取预设的神经网络模型,利用所述训练集中的训练样本数据对所述神经网络模型进行训练,得到初始分类器;
将所述验证集中的验证数据输入至所述初始分类器,利用验证集对初始分类器进行进一步训练和验证,得到多个验证数据对应的类别概率;
直到所述验证数据对应的类别概率在预设范围内的数量达到预设阈值时,停止训练,得到所需的分类器。
5.根据权利要求1所述的方法,其特征在于,所述根据所述多个事件元素和相应的事件元素参数生成所述目标事件类别对应的事件图谱数据,包括:
根据所述事件元素和事件元素参数生成对应的多个元素节点和节点信息;
对多个元素节点和相应的节点信息进行关联性分析,得到多个元素节点的关联关系;
根据所述关联关系对多个元素节点进行映射与合并,通过节点链接技术将多个元素节点进行关联连接;
根据连接的多个元素节点和相应的节点信息生成所述目标事件类别对应的事件图谱数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910844517.1/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置