[发明专利]嵌入式智能终端异常数据的检测方法和嵌入式智能终端在审
申请号: | 201711375673.5 | 申请日: | 2017-12-19 |
公开(公告)号: | CN108337226A | 公开(公告)日: | 2018-07-27 |
发明(设计)人: | 胡琳琳;耿筱林;郭志川 | 申请(专利权)人: | 中国科学院声学研究所 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;H04L29/08;G06F17/30 |
代理公司: | 北京亿腾知识产权代理事务所 11309 | 代理人: | 陈霁 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 异常数据 智能终端 嵌入式 聚类簇 聚类图 有向图 检测 关系构造 计算资源 数据包含 预设条件 运行效率 终端设备 检测率 误报率 聚类 输出 挖掘 | ||
本发明提供了一种嵌入式智能终端异常数据的检测方法和嵌入式智能终端,该检测方法包括:接收待测数据,待测数据包含异常数据;确定待测数据中的对象,每个对象的k近邻,以及对象之间的k近邻关系;根据对象之间的k近邻关系构造k近邻有向图;根据k近邻有向图构造k‑聚类图,并对k‑聚类图中的聚类簇进行标记;当聚类簇中的部分聚类簇满足预设条件时,部分聚类簇中的待测数据作为异常数据输出。该方法能够在终端设备计算资源有限的情形下,使用图聚类方法对嵌入式智能终端环境进行小规模的异常数据挖掘,检测率较高,运行效率较高,同时减少了误报率。
技术领域
本发明涉及本发明涉及网络安全领域,尤其涉及一种嵌入式智能终端异常数据检测方法和嵌入式智能终端。
背景技术
随着互联网技术的不断发展,网络安全逐渐成为了一项热门,几乎每天都会产生新的安全威胁。面对这样一些规模逐渐庞大、类型变化多端的攻击,应用机器学习或数据挖掘技术对数以万计的新类型安全威胁进行训练和识别逐渐成为了主流趋势。
在嵌入式环境下,需要对采集到的一些数据进行异常检测,而数据挖掘领域的许多方法,只有在数据规模较大的情形下才能显现出优势,例如神经网络,对于计算资源有限的环境,数据挖掘领域的方法显得比较复杂,且检测率较低。
本发明的目的在于,能够在终端设备计算资源有限的情形下、采用云端辅助的方式,通过一种基于图聚类的方式在嵌入式智能终端环境中进行小规模的异常数据挖掘,检测出异常数据。与数据挖掘领域其他算法相比,便于实现,也表现出较高的检测率;终端数据的属性种类较少,运行算法效率较高;如果对检测率有更高的要求,可以请求云端协同完成;此外,该方法还改善了基于传统的K-Means的异常检测算法在用于异常检测时需要预先设定簇的个数的问题,提高了聚类算法对于任意形状的簇的聚类质量,增加了异常数据的检测率,减少了误报率。
发明内容
本发明提供了一种嵌入式智能终端异常数据检测方法和嵌入式智能终端,解决了计算资源有限环境下,进行异常数据检测检测效率低的问题。
第一方面,提供了一种嵌入式智能终端异常数据的检测方法,该检测方法包括:
接收待测数据,待测数据包含异常数据;
确定待测数据中的对象,每个对象的k近邻,以及对象之间的k近邻关系;
根据对象之间的k近邻关系构造k近邻有向图;
根据k近邻有向图构造k-聚类图,并对k-聚类图中的聚类簇进行标记;
当聚类簇中的部分聚类簇满足预设条件时,部分聚类簇中的待测数据作为异常数据输出。
可选地,在一个可能实现的方式中,在对k-聚类图中的聚类簇进行标记之后;检测方法还包括:
当聚类簇中的部分聚类簇满足预设条件时,向云端服务器发送请求消息,请求消息用于云端服务器对部分聚类簇中的待测数据进行计算,获得异常数据并输出。
可选地,在一个可能实现的方式中,云端服务器对部分聚类簇中的待测数据进行计算,获得异常数据并输出,包括:
云端服务器计算部分聚类簇中的待测数据基于簇的离群点因子;
当部分聚类簇中的待测数据基于簇的离群点因子满足预设阈值时,确定部分聚类簇中待测数据作为异常数据输出。
可选地,在一个可能实现的方式中,根据k近邻有向图构造k-聚类图,包括:
根据k近邻有向图中的k-互邻居关系构造k-聚类图。
第二方面,提供了一种嵌入式智能终端,嵌入式智能终端包括存储器和处理器,以及存储器中存储的计算机程序,当处理器调用存储器中的计算机程序时,处理器执行以下操作:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所,未经中国科学院声学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711375673.5/2.html,转载请声明来源钻瓜专利网。