[发明专利]流量识别模型的训练方法、装置及电子设备有效
申请号: | 201910992658.8 | 申请日: | 2019-10-18 |
公开(公告)号: | CN110717551B | 公开(公告)日: | 2023-01-20 |
发明(设计)人: | 张大松;姜洪朝 | 申请(专利权)人: | 中国电子信息产业集团有限公司第六研究所 |
主分类号: | H04L47/2441 | 分类号: | H04L47/2441;H04L47/2483;G06N20/00;H04L9/40;G06F18/214;G06F18/24;G06F18/23 |
代理公司: | 北京超成律师事务所 11646 | 代理人: | 许书音 |
地址: | 102200 北京市昌平*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 流量 识别 模型 训练 方法 装置 电子设备 | ||
本发明实施例提出一种流量识别模型的训练方法、装置及电子设备,涉及工业控制技术领域。其中,上述流量识别模型的训练方法包括获取样本流量集合;所述样本流量集合包括侦测到的多个协议流量的样本特征信息;依据所述样本流量集合中的样本特征信息,动态确定聚类中心的第一数量,以便依据得到的所述第一数量将所述样本流量集合划分为多个样本聚类;利用得到的所述样本聚类,对预设的机器学习模型进行训练,得到所述流量识别模型。如此,即使不具有先验知识,也能够自动、准确地对样本流量集合内的样本分类。从而,提高得到的流量识别模型的识别精度。
技术领域
本发明涉及工业控制技术领域,具体而言,涉及一种流量识别模型的训练方法、装置及电子设备。
背景技术
随着工业控制领域的网络化和信息化的推进,工控网络系统越来越庞大,开放性越来越高。然而,工控网络系统对数据传输的质量有较高的要求,对病毒等影响系统安全的事件极其敏感。因此,工控网络安全成为了工业控制领域的严峻的挑战。
对工控协议流量是否正常的识别是实现保障工控网络安全的第一步。基于机器学习的流量识别是极具前景的流量识别方法。但是,目前为了确保机器学习的准确性,需要大量的样本对流量识别模型进行训练。训练前需要人为指定样本类别数量,对于表征新出现且少量的异常流量的样本,由于缺乏先验知识,使得对样本分类不够准确,导致训练得到的流量识别模型在实际应用中准确性不够理想。
发明内容
有鉴于此,本发明的目的在于提供一种流量识别模型的训练方法、装置及电子设备。
为了实现上述目的,本发明实施例采用的技术方案如下:
第一方面,本发明实施例提供一种流量识别模型的训练方法,所述方法包括:获取样本流量集合,其中,所述样本流量集合包括侦测到的多个协议流量的样本特征信息;依据所述样本流量集合中的样本特征信息,动态确定聚类中心的第一数量,以便依据得到的所述第一数量将所述样本流量集合划分为多个样本聚类;利用得到的所述样本聚类,对预设的机器学习模型进行训练,得到所述流量识别模型。
第二方面,本发明实施例提供一种流量识别模型的训练装置,所述装置包括:获取模块,用于获取样本流量集合;所述样本流量集合包括侦测到的多个协议流量的样本特征信息;处理模块,用于依据所述样本流量集合中的样本特征信息,动态确定聚类中心的第一数量,以便依据得到的所述第一数量将所述样本流量集合划分为多个样本聚类;训练模块,用于利用得到的所述样本聚类,对预设的机器学习模型进行训练,得到所述流量识别模型。
第三方面,本发明实施例提供一种电子设备,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的机器可执行指令,所述处理器可执行所述机器可执行指令以实现前述实施方式任一所述的方法。
第四方面,本发明实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如前述实施方式中任一项所述的方法。
与现有技术相比,本发明实施例提供的流量识别模型的训练方法,通过依据获取的样本流量集合中的样本特征信息,动态确定聚类中心的第一数量,以便依据第一数量将所述样本流量集合划分为多个样本聚类。通过实现自适应地确定聚类数量,确保对样本流量集合的准确聚类。然后,利用聚类得到的样本聚类,对预设的机器学习模型进行训练,得到流量识别模型。如此,即使不具有先验知识,也能够自动、准确地对样本流量集合内的样本分类。从而,提高得到的流量识别模型的识别精度。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子信息产业集团有限公司第六研究所,未经中国电子信息产业集团有限公司第六研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910992658.8/2.html,转载请声明来源钻瓜专利网。