[发明专利]一种数据处理方法和装置有效
申请号: | 201811643437.1 | 申请日: | 2018-12-29 |
公开(公告)号: | CN109670267B | 公开(公告)日: | 2023-06-13 |
发明(设计)人: | 杨方廷;贾彦江 | 申请(专利权)人: | 北京航天数据股份有限公司 |
主分类号: | G06F18/214 | 分类号: | G06F18/214;G06F18/24 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 彭星 |
地址: | 100088 北京市海淀区北四*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 装置 | ||
1.一种数据处理方法,其特征在于,包括:
获取用户的数据识别请求,所述数据识别请求中携带有待识别数据;
基于所述待识别数据的属性信息,为所述用户确定数据识别工业模型;
将所述待识别数据输入到所述数据识别工业模型进行识别处理,得到识别结果;
将所述识别结果发送给所述用户;
其中,根据以下方式训练所述数据识别工业模型:
从样本数据库中获取训练数据;
基于所述训练数据和多个预设模型,配置各所述预设模型的初始参数;
将所述训练数据配置到各所述预设模型中,对各所述预设模型进行训练,得到各完成训练的预设模型、各预设模型对应的训练结果和模型准确率;
判断所述训练结果是否满足预设的条件,若不满足,则根据所述训练结果调整各所述预设模型的参数,对调整参数之后的所述预设模型进行再训练,直到所述训练结果满足预设的条件;
基于各预设模型对应的模型准确率,从各完成训练的预设模型中,确定所述数据识别工业模型;
其中,针对各预设模型,配置各所述预设模型的初始参数,包括以下步骤:
根据预设模型,获取多个不同特征的数据;
将数据进行排列,形成矩阵模型;
对矩阵模型进行弹性分布式数据集数据序列化处理,对矩阵模型的弹性分布式数据集进行关联分析,选择关联度小于预设关联度值的矩阵模型的弹性分布式数据集进行组合,得到工业模型对应的训练数据;
在所述为所述用户确定数据识别工业模型之后,还包括:
依据数据识别请求使用所述数据识别工业模型的第一用户数,为所述数据识别工业模型配置第一运行环境;
依据数据识别请求使用所述数据识别工业模型的第二用户数,将所述数据识别工业模型虚拟化为所述第二用户数个工业模型副本;
依据所述第二用户数对应的用户信息,以及第一运行环境,为所述用户配置第二运行环境;
在所述第二运行环境中运行为所述用户配置的数据识别工业模型副本。
2.如权利要求1所述的方法,其特征在于,所述基于所述待识别数据的属性信息,为所述用户确定数据识别工业模型,包括:
获取与所述属性信息对应的预设模型的使用权信息;
依据所述使用权信息,确定所述用户完成对所述预设模型的使用权交易,将完成所述使用权交易的所述预设模型作为所述数据识别工业模型。
3.如权利要求1所述的方法,其特征在于,根据以下方式构建预设模型:
在算法编辑器中编辑多个算法,将所述多个算法保存在算法列表中;
从所述算法列表中选择算法对预设的训练数据进行处理,得到所述算法列表中每个算法对应的算法文件;
对多个所述算法文件进行对比,根据对比结果从所述算法列表中选择一种算法,根据选择的所述算法生成所述预设模型。
4.如权利要求1所述的方法,其特征在于,根据以下方式构建所述样本数据库,包括:
获取设备的运行数据;
根据预先设定的映射关系,将所述运行数据映射为元数据;
将所述元数据形成所述样本数据库。
5.如权利要求1所述的方法,其特征在于,还包括:
获取数据源的原始数据;
解析所述原始数据携带的源端地址,得到所述原始数据的详细数据信息;
确定所述原始数据所属的数据源以及数据结构,依据确定的所述数据源以及数据结构映射的数据特征,从所述详细数据信息中提取与所述映射的数据特征相匹配的字段,得到所述原始数据的数据特征;
按照预先设置的目标元数据映射表,对所述原始数据的数据特征进行提取,得到待存储目标数据特征;
将所述待存储目标数据特征存储在工业元数据库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航天数据股份有限公司,未经北京航天数据股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811643437.1/1.html,转载请声明来源钻瓜专利网。