[发明专利]一种基于学习的物联网实体消息解析方法有效
申请号: | 201910941962.X | 申请日: | 2019-09-30 |
公开(公告)号: | CN110866169B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 吴际 | 申请(专利权)人: | 北京奥陌科技有限公司 |
主分类号: | G06F16/953 | 分类号: | G06F16/953;G06F16/35;G06F16/36;H04L69/22 |
代理公司: | 北京理工大学专利中心 11120 | 代理人: | 刘芳;仇蕾安 |
地址: | 100084 北京市海淀区农*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 学习 联网 实体 消息 解析 方法 | ||
1.一种基于学习的物联网实体消息解析方法,其特征在于,包括以下步骤:
步骤1、根据预设的物联网实体消息特征,将物联网实体的历史消息表示为消息特征向量,对所述消息特征向量进行聚类分析,得到所述消息特征向量的分类标签;
步骤2、以所述消息特征向量作为样本的输入、所述分类标签作为样本的输出,构建分类元模型样本数据集;采用所述分类元模型样本数据集训练多个机器学习模型,通过对所述多个机器学习模型进行交叉验证与参数调节,得到多个分类元模型;所述分类元模型的输入为所述消息特征向量,输出为所述历史消息的类型置信度向量;
步骤3、以所述类型置信度向量作为样本的输入、所述历史消息的类型作为样本的输出,构建分类基模型样本数据集;使用模型集成法将多个所述分类元模型结合起来得到分类基模型,采用所述分类基模型样本数据集训练所述分类基模型,得到物联网实体消息分类器;
步骤4、采用所述物联网实体消息分类器对物联网实体消息进行分类,然后采用对应类别的解析方式,对分类后的物联网实体消息进行解析。
2.根据权利要求1所述的方法,其特征在于,所述步骤4中对分类后的物联网实体消息进行解析,包括以下步骤:
步骤4.1、以所述历史消息对应的字符串作为样本的输入,将所述字符串对应的解析结果表示为01序列,以所述01序列作为样本的输出,构建解析元模型样本数据集;采用所述解析元模型样本数据集训练多个时间序列模型,得到多个解析元模型;所述解析元模型的输入为所述字符串,输出为所述字符串的解析置信度向量;
步骤4.2、以所述字符串的解析置信度向量作为样本的输入、所述01序列作为样本的输出,构建解析基模型样本数据集;使用模型集成法将多个所述解析元模型结合起来得到解析基模型,采用所述解析基模型样本数据集训练所述解析基模型,得到物联网实体消息解析器;
步骤4.3、采用所述物联网实体消息解析器解析所述分类后的物联网实体消息,得到对应的解析01序列,再使用所述解析01序列对所述分类后的物联网实体消息进行字符串提取,得到物联网实体消息有效子串,再对所述有效子串进行类型化。
3.根据权利要求1所述的方法,其特征在于,所述步骤4中对分类后的物联网实体消息进行解析,采用正则模式解析规则实现。
4.根据权利要求1所述的方法,其特征在于,所述类型置信度向量采用独特码实现。
5.根据权利要求1所述的方法,其特征在于,所述步骤1中的物联网实体消息特征包括:文本序列、长度、词频、字符占比、发送时段、时间间隔、发送次数设备类型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奥陌科技有限公司,未经北京奥陌科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910941962.X/1.html,转载请声明来源钻瓜专利网。