[发明专利]一种基于条件随机场的物联网数据序列标注模型在审

专利信息
申请号: 202010220216.4 申请日: 2020-03-25
公开(公告)号: CN111414700A 公开(公告)日: 2020-07-14
发明(设计)人: 倪巍 申请(专利权)人: 华存数据信息技术有限公司
主分类号: G06F30/20 分类号: G06F30/20
代理公司: 北京化育知识产权代理有限公司 11833 代理人: 尹均利
地址: 200000 上海市浦东新区中国(上海)*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 条件 随机 联网 数据 序列 标注 模型
【说明书】:

发明公开了一种基于条件随机场的物联网数据序列标注模型,基于条件随机场的物联网数据序列标注模型中技术方案的架构图,是依据对象‑关系概率模型进行设计的,主要考虑两类的结构不确定性:关系不确定性,对象不确定性,即领域中实际对象的真实集合对分布建模,设计的架构为数据预处理模块、序列参数化与因子分析、确定成分构建确定性CPD、物理成因分析以及随机成分构建条件随机场。整个模型既融合了序列标注任务所需的信息,有助于模型对于实体的判断,又结合了上下文信息的表示能力,还保留CRF层求解标签序列的全局最优解的能力,从而为模型产生最优结果创造了可能。

技术领域

本发明属于计算机应用(数据挖掘)领域,涉及一种基于条件随机场模型及其在物联网数据上序列标注任务的应用。

背景技术

物联网数据主要是指传感器和设备发过来的数据。这些数据一部分是对现实环境参数的采集值,一部分是设备的一些常规信息值,比如:部件状态、故障信息、运行情况等。物联网数据在任何情况下都会产生数据,无需人为参与就不会不断涌现出新的数据,其数据量远远大于传统业务系统的业务数据。如果,物联网只是负责采集一堆传感器和设备发过来的数据,那就只不过是一堆庞大的数据聚集在一起,产生不了实际的价值意义。

在物联网数据处理中,很多业务问题都可以利用序列标注模型解决,比如工业生产中的流水线核心部件运行状态预告预警、传感器数据去噪、生产过程标注等。复杂的标注任务可以分解成分段任务(segmentation)和标注任务 (tagging)这两个基本的标注任务。另外,物联网数据序列中时间序列数据中间的每个时刻的结果都可以使用元组(V,t)表示。V为需要观测的值;t为观测的值发生的时间,一个时间序列通常由多个元组组成,表示为{(V1,t1), (V2,t2),…,(Vn,tn)},其中t1,t2…,tn,按照观测值发生时间的先后顺序有序排列。将物联网的数据看做一个序列输入,输出的是一个等长的符号序列,其中每个符号都具有特定的抽象的或包含具体业务的含义。在没有歧义的前提下,我们将具有特定含义的符号称为标签(1abel),作为结果输出的序列称为标签序列,而输入序列称为观察序列。通常而言,标签之间存在一定联系的,因此序列标注问题不是一个传统的分类问题,而是一个复杂的结构化机器学习问题。序列标注问题可以形式化地表示为:

目前的物联网数据序列标注在应用中主要存在如下四个问题:第一,与一元数据序列标注相比,多元数据序列标注的研究相对较少。第二,传统的数据序列标注方法大多基于判别式模型(Discriminative Model),该类结果可解释性差,难以凸显多元指标间的交互影响关系。第三,对动态环境建模,且在时序环境中,我们希望获得状态在随时间变化的系统上的表示分布,而非单纯的求得指标固定集合的模型。在实践过程里得知:物联网数据的特征变量之间的交互影响自然指定方向很难确定与论证,例如两个相互作用的物理系统变量。因此问题第四个,需要一种能融合有向依赖性和无向依赖性的标注模型。

基于此,针对上述现状中存在的问题,本发明提出了一种有效且可解释的基于条件随机场(Conditional Random Field,CRF)的物联网数据序列标注模型。

发明内容

本发明的目的在于提供一种基于条件随机场的物联网数据序列标注模型,以解决上述背景技术中提出的问题。

为实现上述目的,本发明提供如下技术方案:一种基于条件随机场的物联网数据序列标注模型,基于条件随机场的物联网数据序列标注模型中技术方案的架构图,是依据对象-关系概率模型进行设计的,主要考虑两类的结构不确定性:关系不确定性,即对象之间的关系存在或不存在的情况下对分布建模;对象不确定性,即领域中实际对象的真实集合对分布建模。

进一步的,其设计的架构包含数据预处理模块、序列参数化与因子分析、确定成分构建确定性CPD、物理成因分析以及随机成分构建条件随机场。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华存数据信息技术有限公司,未经华存数据信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010220216.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top