[发明专利]一种基于提示自监督学习网络安全溯源语义识别方法有效
申请号: | 202210184902.X | 申请日: | 2022-02-28 |
公开(公告)号: | CN114254655B | 公开(公告)日: | 2022-05-10 |
发明(设计)人: | 胡牧;孙捷;车洵;梁小川 | 申请(专利权)人: | 南京众智维信息科技有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F16/35;G06N3/04;G06N3/08;H04L9/40 |
代理公司: | 南京知识律师事务所 32207 | 代理人: | 张苏沛 |
地址: | 211300 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 提示 监督 学习 网络安全 溯源 语义 识别 方法 | ||
本发明公开了一种基于提示自监督学习网络安全溯源语义识别方法,包括以下步骤:构建网络安全专业语料库;多维度丰富,重建对话中捕获攻击源的数据集;变压器编码部分识别语义特征,并向量化表示;用变压器解码选择关键语义;与真实标签训练交叉熵损失,并训练模型参数;多次迭代优化模型输出对应标签,识别对应IP或域名;方法把变压器模型作为掩码语言模型的基础结构,可以根据外部信息和上下文内容对文本进行语义识别,可以针对数据集资源不丰富的网络安全专业词汇进行掩码语言模型的提示学习来充分挖掘已有数据的信息,从而实现高效率,低成本的语义提取,让机器理解真人的意图。
技术领域
本发明涉及网络安全自然语言处理领域,特别涉及一种基于提示自监督学习网络安全溯源语义识别方法。
背景技术
随着信息数据的时代的发展,人们对网络安全的意识逐渐提高,数据和智能驱动的安全对抗,技术平台的自动化、智能化水平,愈发成为网络空间中攻防双方角力的重点。网络安全溯源语义识别作为智能安全运营主要任务之一,对由作战室中聊天记录组成的文档提取核心的信息块转化成被总结归纳的摘要是网络安全溯源语义识别关键技术。对于安全事件溯源的语义识别可以更好通过关注作战室中的安全设备告警、邮件钓鱼、蜜罐警告和日志信息等一系列关键信息进行分析理解,有助于对文本内容负载冗余信息降维处理,用简洁易读的命令形式在网络安全溯源语义识别任务中进行网络安全应急响应。网络安全溯源语义识别不是简单得压缩作战室的文本内容,而是提取作战室中作战参谋,总指挥和处置人员等文本优先级处理识别的核心内容,实现低冗余,信息多样的识别过程。目前大多数研究工作都集中在对单角色语义识别的任务上,然后从文本中识别溯源日志信息等关键信息,根据其识别数据源是否人工标记,可分为有监督合成和无监督合成。
传统的网络安全溯源语义上通常依靠人工对攻击源进行标记导致操作状态变化的安全领域事件,记录的影响安全状态的事件,这是有监督网络安全溯源语义识别,有很大的局限性,对语义识别的精度预测较低并且需要极大的人力计算开销和时间成本。
最近的方法上网络安全溯源语义识别是建模序列标注任务进行处理,对作战室中的每一句话进行监督学习,通过分类器判别是否进行网络安全应急响应,其技术核心在于特征工程的获取,大多数是基于循环神经网络架构的模型网络安全溯源语义识别。但是,这类获取特征的手段有三个问题:
(1)监督学习下的网络安全溯源语义识别任务需要经过大量数据捕获攻击源进行信息溯源,但是在网络安全专业领域内的数据集资源不丰富,人工标注的监督数据成本太高;
(2)对作战室中的作战参谋、总指挥、处置人员等不同角色输入的文本序列的特征提取注意力相同,换句话说就是循环神经网络模型架构就是记住了作战室文本中的所有信息,这造成对于一句话中关键信息取决于这句话中词的物理位置,不取决于词本身的意义,这就会导致记忆信息冗余;
(3)基于循环神经网络架构的模型通常是处理短文档语义提取技术,而聊天对话和逻辑清晰,结构性强的单角色文档对比则完全相反,这时捕捉文字内容的特征工作显得尤为重要。
基于以上考虑,急需提供一种基于提示自监督学习网络安全溯源语义识别方法,以解决上述问题。
发明内容
为此,需要提供一种通过对网络安全事件的应急和溯源过程中,用作战室的方式进行协同应急工作,实现高效率、低成本的语义提取。
为实现上述目的,发明人提供了一种基于提示自监督学习网络安全溯源语义识别方法,包括以下步骤:构建网络安全专业语料库;多维度丰富,重建对话中捕获攻击源的数据集;用变压器编码部分识别语义特征,并向量化表示;用变压器解码选择关键语义;与真实标签训练交叉熵损失,并训练模型参数;多次迭代优化模型输出对应标签,识别对应IP或域名。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京众智维信息科技有限公司,未经南京众智维信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210184902.X/2.html,转载请声明来源钻瓜专利网。