[发明专利]一种海量异构传感器格式数据的解析方法有效

专利信息
申请号: 201810333797.5 申请日: 2018-04-13
公开(公告)号: CN108763289B 公开(公告)日: 2021-11-23
发明(设计)人: 沈玉龙;胡晓康;马冬洁;邬俊杰;马飞昊;张立;潘超杰;郝飞扬;常二慧;陈俊峰;郑佳伟;张欢 申请(专利权)人: 西安电子科技大学
主分类号: G06F16/90 分类号: G06F16/90;G06K9/62
代理公司: 西安长和专利代理有限公司 61227 代理人: 黄伟洪
地址: 710071 陕西省*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 海量 传感器 格式 数据 解析 方法
【说明书】:

发明属于物联网技术领域,公开了一种海量异构传感器格式数据的解析方法,初始化C‑TF‑IDF测量器模块,使用K‑Means算法对数据进行聚类模块,数据模板模块,利用规则模板解析传感器信息模块,根据数据集聚类准确度对脏数据进行清洗或回溯优化信息模板库模块。本发明可以满足物联网传感器数据实时处理的需求,并且针对数据集动态变化的特点,融合自修正模块,自动过滤脏数据或者生成新的解析规则;实现解析传感器数据准确度大于95%;可以选择清洗数据集中的脏数据或回溯优化规则模板。本发明可以达到自动解析其信息的效果;对于不同的传感器环境,通过调节准确度和自修正参数来使系统在不同的环境下达到一个综合的最佳效果。

技术领域

本发明属于物联网技术领域,尤其涉及一种海量异构传感器格式数据的解析方法。

背景技术

目前,业内常用的现有技术是这样的:面对各行各业不同环境下的物联网应用,物联网平台会接入各种不同厂商所提供的传感器设备,而传感器设备发送的数据包格式都不尽相同。为了解析这些异构传感器数据,需要人工设定解析规则,从而将每条数据中的可用信息提取出来。当传感器数据量庞大,异构数据大量混合传入时;如果单纯地依靠人工编写每类数据的解析规则,那么平台将很难满足广大用户的需求,并且对于平台也是一个很大的人工耗损。为了解决这个问题,现有的物联网平台都制定了传感器数据的格式,平台接收到的数据都具有统一的字段含义。这种方法较为简便,但同时也限定了传感器数据格式的多样性,所以通过限制接入的传感器设备数据格式的方法并不能有效地解决传感器数据海量异构的问题。综上所述,现有的技术存在的问题是:面对海量异构传感器数据,只能通过人工设定其解析规则,没有实现对海量异构传感器数据的自动抽取和解析。技术问题不能得到解决的原因:1传感器数据封装格式类别的多样性,以及新的数据封装格式的传感器的接入;2传感器数据量庞大,没法使用人工识别每条数据的解析规则;3数据集是实时更新的,不是一个固定的数据集。

综上所述,现有技术存在的问题是::面对海量异构传感器数据,只能通过人工设定其解析规则,没有实现对海量异构传感器数据的自动抽取和解析。

解决上述技术问题的难度和意义:技术问题不能得到解决的原因:传感器数据封装格式类别的多样性,以及新的数据封装格式的传感器的接入;传感器数据量庞大,没法使用人工识别每条数据的解析规则;数据集是实时更新的,不是一个固定的数据集。

发明内容

针对现有技术存在的问题,本发明提供了一种海量异构传感器格式数据的解析方法。

本发明是这样实现的,一种海量异构传感器格式数据的解析方法,所述海量异构传感器格式数据的解析方法收集传感器数据,初始化C-TF-IDF测量器,使用K-Means算法对数据进行聚;数据模板自修正,利用规则模板解析传感器信息模块,根据数据集聚类准确度对脏数据进行清洗或回溯优化信息模板库。

进一步,所述海量异构传感器格式数据的解析方法包括以下步骤:

步骤一,收集大量的传感器数据作为元数据;

步骤二,使用元数据初始化C-TF-IDF测量器;

步骤三,确定字符串数据的相似度比较算法;

步骤四,使用K-Means算法,采用区间递增取极大值的方法选取最适合场景的聚类数目K使得每个类别群的平均数据相似度ADS最大;

步骤五,得到数据模板,并检验准确度,在准确度不大于阈值时进行数据模板自修正;

步骤六,生成规则模板,利用规则模板解析传感器信息;

步骤七,新加入的数据占总数据达到比例时,系统自动检验数据集聚类准确度,根据数据集聚类准确度对数据进行清洗或回溯优化信息模板库。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810333797.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top