[发明专利]一种基于数据分布自适应间隔的少样本复杂关系抽取方法在审
申请号: | 202111422588.6 | 申请日: | 2021-11-26 |
公开(公告)号: | CN114138935A | 公开(公告)日: | 2022-03-04 |
发明(设计)人: | 张岐坦;翟利志;钟麟;汪涛;高学攀;杜楚;卜毅明;任海洋;陈路路;陈金勇;苌军红 | 申请(专利权)人: | 中国电子科技集团公司第五十四研究所 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/295;G06K9/62 |
代理公司: | 河北东尚律师事务所 13124 | 代理人: | 王文庆 |
地址: | 050081 河北省石家*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据 分布 自适应 间隔 样本 复杂 关系 抽取 方法 | ||
1.一种基于数据分布自适应间隔的少样本复杂关系抽取方法,其特征在于,通过构造元任务,基于数据分布自适应间隔和负样本机制,对复杂关系进行抽取。
2.根据权利要求1所述的一种基于数据分布自适应间隔的少样本复杂关系抽取方法,其特征在于,包括以下步骤:
步骤1,将包含文本实例、关系三元组的训练数据按照N-way k-shot的方式划分为一系列元任务,存放在任务列表[Task0,Task1,…]中;每个元任务均包含支持集和查询集,支持集与查询集中实例数量之比为2:1~3:1;
步骤2,构建编码阶段预训练网络,对每个元任务中的数据进行处理,获得对文本的编码;
步骤3,对步骤1得到的支持集/查询集的文本进行编码,得到向量表示;取当前实例中实体对应位置的向量,进行聚合,得到每个实体的向量表示;
步骤4,将支持集/查询集中的实体向量表示两两组合并进行拼接,得到[ei,ej],i、j为实体序号,i≠j;
步骤5,步骤1得到的支持集/查询集中包含N+个关系类别[R1,R2,…,RN+],将步骤4得到的实体对表示按对应关系存放,若实体对不存在关系,则存放为None类别,并求得每类关系下实体对表示的均值作为每类关系的向量簇心,即每类关系的向量表示,由此得到度量空间;
步骤6,计算步骤4得到的支持集和查询集的所有待预测的实体对表示与度量空间中的每类关系簇心的欧式距离,并通过激活函数进行关系类别预测;
步骤7,运行大量的元任务,重复执行步骤2至步骤6,通过梯度下降的方式来训练编码阶段预训练网络,更新网络参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第五十四研究所,未经中国电子科技集团公司第五十四研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111422588.6/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置