[发明专利]基于BioBERT与改进Focal loss的药物互作信息提取方法在审
申请号: | 202310082731.4 | 申请日: | 2023-02-01 |
公开(公告)号: | CN116072306A | 公开(公告)日: | 2023-05-05 |
发明(设计)人: | 韩惠蕊;李晋 | 申请(专利权)人: | 海南医学院 |
主分类号: | G16H70/40 | 分类号: | G16H70/40;G06F40/30;G06F40/205;G06F16/35 |
代理公司: | 北京汇众通达知识产权代理事务所(普通合伙) 11622 | 代理人: | 杨倩 |
地址: | 571199 海*** | 国省代码: | 海南;46 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及信息提取技术领域,且公开了基于BioBERT与改进Focal loss的药物互作信息提取方法,该方法使用生物医学语料库预训练的BioBERT模型对文本序列进行预处理,该模型遵循基于R‑BERT的结构,对于有两个标记药物实体e1和e2的句子,通过BioBERT层的标记嵌入、段嵌入和位置嵌入得到语义向量。本发明将生物医学语料库(BioBERT)上预训练的双向编码器表示应用于生物医学文献中的DDI提取。BioBERT得到代表句子中实体的语义向量后,将句子中两个实体的嵌入平均为两个向量,连接第一个token,并通过激活操作通过全连接层。此外,本发明探索了一种改进的focal loss损失函数来处理不平衡数据。在DDIExtraction 2013上进行训练后得出,本发明的性能f值达到了80.45%,与传统交叉熵损失函数的BioBERT方法相比,取得了显著的改进。 | ||
搜索关键词: | 基于 biobert 改进 focal loss 药物 信息 提取 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海南医学院,未经海南医学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202310082731.4/,转载请声明来源钻瓜专利网。