[发明专利]关系抽取模型的训练方法、关系抽取方法、设备及介质在审

专利信息
申请号: 202011199788.5 申请日: 2020-10-29
公开(公告)号: CN112307170A 公开(公告)日: 2021-02-02
发明(设计)人: 王旭仁;江钧;汪秋云;杨杰;姜政伟;刘宝旭 申请(专利权)人: 首都师范大学;中国科学院信息工程研究所
主分类号: G06F16/33 分类号: G06F16/33;G06F16/35;G06F21/55;G06F40/211;G06F40/295;G06K9/62
代理公司: 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 代理人: 李莎
地址: 100037 北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 关系 抽取 模型 训练 方法 设备 介质
【说明书】:

发明提供一种关系抽取模型的训练方法、关系抽取方法、设备及介质,涉及威胁情报关系处理技术领域。该方法包括:对数据集中每个文本语料中的多个句子实例进行特征处理,得到每个句子实例的初始特征;通过特征转换器对初始特征进行转换,得到每个句子实例的句子特征;通过句子实例选择器,根据每个句子实例的句子特征,从多个句子实例中选择目标句子实例;通过关系分类器对目标句子实例进行关系分类,得到目标句子实例的实体关系分类结果;根据实体关系分类结果和预先标注实体关系,对句子实例选择器和关系分类器的参数进行训练优化,得到目标关系抽取模型。本发明通过优化关系抽取模型,提高模型的关系分类精度。

技术领域

本发明涉及威胁情报关系处理技术领域,具体而言,涉及一种关系抽 取模型的训练方法、关系抽取方法、设备及介质。

背景技术

伴随着互联网的迅猛发展,针对组织和公司的威胁和变体源源不断。 不仅政府和公共部门临着前所未有的网络攻击,基础设施遭受黑客攻击, 而且个人和企业也容易受到网络攻击,造成隐私、财务和经济等各方面的 持续威胁。逐渐升级的APT(AdvancedPersistent Threat,高级持续性威胁) 攻击手法使原先的威胁应对措施很难解决实质性网络威胁。因此,网络空 间安全机构正在寻求各种手段增加威胁情报数据的知识库,从而更好地为 安全团队提供最新的攻击手段和威胁解决方案的开发。对威胁情报进行收 集,分析和深度研究,以动态扩展的威胁解决方案来应对攻击者的入侵。

在现有的威胁情报的实体关系提取方法中,多采用传统的依赖人工和 规则的实体关系提取方法,对句子特征的提取不够完整,对噪音数据的过 滤不够充分,使得威胁情报的实体关系提取的准确率比较低。

发明内容

本发明的目的在于,针对上述现有技术中的不足,提供一种关系抽取 模型的训练方法、关系抽取方法、设备及介质,以便快速识别威胁情报中 实体之间的关系,并提高实体关系提取的准确率。

为实现上述目的,本发明实施例采用的技术方案如下:

第一方面,本发明实施例提供了一种关系抽取模型的训练方法,所述 关系抽取模型包括:特征转换器、句子实例选择器和关系分类器,所述方 法包括:

对关系抽取数据集中的每个文本语料中的多个句子实例进行特征处理, 得到每个句子实例的初始特征;其中,所述关系抽取数据集包括:多个文 本语料,每个句子实例为预先标注有实体关系的威胁情报文本;

通过所述特征转换器,对所述每个句子实例的初始特征进行特征转换, 得到所述每个句子实例的句子特征;

通过所述句子实例选择器,根据所述每个句子实例的句子特征,从所 述多个句子实例中选择目标句子实例;

通过所述关系分类器对所述目标句子实例进行关系分类,得到所述目 标句子实例的实体关系分类结果;

根据所述实体关系分类结果和预先标注的实体关系,对所述句子实例 选择器和所述关系分类器的参数进行训练优化,得到目标关系抽取模型, 所述目标关系抽取模型包括:训练优化后的所述句子实例选择器和训练优 化后的关系分类器。

具体的,所述对关系抽取数据集中的每个文本语料中的多个句子实例 进行特征处理之前,所述方法还包括:

根据预先构建的威胁情报的实体关系知识库,采用远程监督方法,对 多个威胁情报文本进行实体关系的远程监督标注,得到所述多个句子实例。

具体的,所述根据预先构建的威胁情报的实体关系知识库,采用远程 监督方法,对多个威胁情报文本进行实体关系的远程监督标注,得到所述 多个句子实例之前,所述方法还包括:

根据预先确定的威胁情报的实体关系列表,从开源结构化数据中构建 所述实体关系知识库;其中,每个威胁情报文本为非结构化的威胁情报文 本。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于首都师范大学;中国科学院信息工程研究所,未经首都师范大学;中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011199788.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top