[发明专利]一种基于BERT的水稻表型组学知识图谱关系提取方法及系统在审
申请号: | 202010644955.6 | 申请日: | 2020-07-07 |
公开(公告)号: | CN111968700A | 公开(公告)日: | 2020-11-20 |
发明(设计)人: | 袁培森;李润隆;徐焕良 | 申请(专利权)人: | 南京农业大学 |
主分类号: | G16B20/00 | 分类号: | G16B20/00;G16B40/00;G06F16/36;G06N3/04;G06N3/08;G06K9/62 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
地址: | 210095 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 bert 水稻 表型 知识 图谱 关系 提取 方法 系统 | ||
1.一种基于BERT的水稻表型组学知识图谱关系提取方法,包括如下步骤:
(1)根据植物本体论将水稻表型组学关系数据集划分不同关系,关系类型包括is a、has part、has a morphology trait、develop from、participate、regulate和other;
(2)将所述关系数据集进行词向量、位置向量以及段落向量的提取;
(3)将所述词向量、位置向量以及段落向量输入到BERT预训练模型进行训练,建立关系抽取模型;
(4)用户在关系抽取展示网站中输入句子以及句子中的实体,等待反馈;
(5)Django框架中的视图函数在后端提取句子序列的词向量、位置向量以及段落向量,形成特征序列;
(6)BERT关系抽取模型将所述特征序列作为模型输入,输出is a、has part、has amorphology trait、develop from、participate、regulate和other中概率最高的关系类型;
(7)视图函数将后端关系类型名显示到网页前端中,如果用户已经登录,则记录用户的该条搜索记录。
2.根据权利要求1所述基于BERT的水稻表型组学知识图谱关系提取方法,其特征在于:步骤(1)中,所述数据格式为实体1-实体2-关系-句子。
3.根据权利要求1所述基于BERT的水稻表型组学知识图谱关系提取方法,其特征在于,步骤(1)中,所述数据包含如下内容数据:术语名称、术语ID、术语定义、父术语和链接。
4.根据权利要求1所述基于BERT的水稻表型组学知识图谱关系提取方法,其特征在于,步骤(1)中,将所述水稻表型组学关系数据划分为7种关系:
(a)is a,用来表示父术语以及子术语之间的关系,表示A是B的子类型或亚型;
(b)has part,用来表示A物质的每个实例都有部分B的实例;
(c)has a morphology trait,表示A通过B的形态特征表现出来;
(d)develop from,表示A从B发育而来,B的世系可以追溯到A;
(e)participate,表示实体A的每个实例都参与开发B的某些实例;
(f)regulate,A对B有调节或调控作用;
(g)other,表示其它关系。
5.根据权利要求1所述基于BERT的水稻表型组学知识图谱关系提取方法,其特征在于,步骤(3)中,所述BERT预训练模型使用Transformer的编码器来进行编码,所述编码器框架使用了层叠结构。
6.根据权利要求1所述基于BERT的水稻表型组学知识图谱关系提取方法,其特征在于:步骤(3)中,对于输入的向量序列,BERT预训练模型使用具有双向自注意力机制的Transformer编码器来进行处理;在编码器输出后进入全连接层与激活函数构成的分类层,从而输出相应的关系概率。
7.根据权利要求6所述基于BERT的水稻表型组学知识图谱关系提取方法,其特征在于:所述BERT预训练模型使用Softmax分类器来进行分类任务,关系分类的概率P的计算公式如下:
P=softmax(CWT),
式中,C为编码器的输出向量,W为分类层。
8.根据权利要求1所述基于BERT的水稻表型组学知识图谱关系提取方法,其特征在于:步骤(7)中,使用Django框架来进行展示网页前端构建。
9.根据权利要求8所述基于BERT的水稻表型组学知识图谱关系提取方法,其特征在于:所述Django框架使用MTV模式来完成前端以及后端的耦合。
10.一种基于BERT的水稻表型组学知识图谱关系提取系统,其特征在于:包括提取特征向量模块、BERT关系抽取模块和网站,将水稻表型组学关系数据集载入到提取特征向量模块,BERT关系抽取模型根据提取的特征向量进行训练形成BERT关系抽取模型;用户在网站中输入句子以及句子中的两个实体;数据处理模块输出关系类型;网站显示关系类型名称。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京农业大学,未经南京农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010644955.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种介孔氧化铝陶瓷涂覆隔膜及其制备方法
- 下一篇:一种确定转矩的方法及系统