[发明专利]异常情报数据识别机器学习方法在审
申请号: | 201810040497.8 | 申请日: | 2018-01-16 |
公开(公告)号: | CN108268632A | 公开(公告)日: | 2018-07-10 |
发明(设计)人: | 熊伟;崔亚奇;吕亚飞;于艺伟;王海鹏;何友 | 申请(专利权)人: | 中国人民解放军海军航空大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62;G06N99/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 264001 山东省*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 情报数据 机器学习 调试 数据处理领域 训练样本向量 原始数据库 标签数据 概率分布 门限概率 模型参数 模型生成 人工分析 实际工程 实用效果 识别训练 特征提取 异常数据 自动训练 数据集 迭代 信源 应用 情报 | ||
1.异常情报数据识别机器学习方法,其特征在于,包括以下步骤:
步骤1:收集信源的历史情报数据,形成异常情报数据识别训练原始数据库,简称为原始数据库;对正常或异常的情报数据进行人工分析标记,存储相应的情报数据及人工标记结果,形成有标签数据库;
步骤2:根据各情报数据的基本信息,设定情报数据训练样本向量构成,通过特征提取,利用原始数据库生成无标签数据集D1,利用有标签数据库生成有标签数据集D2,共同构成异常情报数据识别训练数据集D;
步骤3:对异常情报数据识别训练数据集D采用数据可视化,拟合异常情报数据识别训练数据集D的概率密度pD,并完成对所拟合的概率密度的参数估计;
步骤4:建立异常情报数据二元分类判别模型,同时建立模型参数优化目标函数,进一步利用有标签数据集训练学习生成模型参数,得到最佳门限概率εbest,生成异常情报数据判别方法。
2.如权利要求1所述的异常情报数据识别机器学习方法,其特征在于,所述步骤1具体包括以下子步骤:
步骤1.1:为保证生成的模型具有较强的泛化能力,在对历史情报数据进行收集时,应保证收集数据的多样性,对不同外部环境及不同工作模式的典型情报数据进行全面收集;
步骤1.2:在形成有标签数据库时,由于难以获取所有情报数据的标签信息,只选取原始数据库中确定为正常情报或异常情报的数据进行标记,并把标记结果与相应情报数据共同存储。
3.如权利要求1所述的异常情报数据识别机器学习方法,其特征在于,所述步骤2具体包括以下子步骤:
步骤2.1:收集各情报数据基本信息,情报数据的基本信息包括目标X方向位置x、X方向速度Y方向位置y、Y方向速度航向c变量,以及目标的国别属性d、敌我属性e,表示为
步骤2.2:以情报数据的基本信息为基础,根据情报数据与上一时刻同一对应目标情报数据的差异,构建训练样本向量x;训练样本向量构建方法为计算情报数据i与同一目标前一时刻情报数据差值,得到X方向位置差值Δxi、X方向速度差值Y方向位置差值Δyi、Y方向速度差值航向差值Δci、国别属性差值Δdi、敌我属性差值Δei,构成情报数据i对应的训练样本向量对于离散属性,在与前一时刻相减时,规定属性相同相减为0,属性不同相减为1,进一步通过非线性函数或核函数得到高维或无限维特征向量;
步骤2.3:根据有标签数据库中情报数据的标签对所构建的训练样本向量进行标记,当该情报数据和前一情报数据均为正常情报数据时,则相减所得的训练样本向量标签记为正常,当其中至少一个情报数据为异常情报数据时,则该训练样本向量的标签记为异常;为保证训练样本的多样性,在前一情报数据为异常情报数据时,应进一步舍弃该异常情报数据与前一相近的正常情报数据相减构建新的训练样本向量;
步骤2.4:根据训练样本向量的构建方法,将原始数据库中的情报数据构建成训练样本向量,得到无标签数据集D1;将有标签数据库中被标记的情报数据构建成训练样本向量,得到有标签数据集D2,共同构成异常情报数据识别训练数据集D。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军海军航空大学,未经中国人民解放军海军航空大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810040497.8/1.html,转载请声明来源钻瓜专利网。