[发明专利]一种基于材料科学实验的数据融合方法及系统在审
申请号: | 201910197620.1 | 申请日: | 2019-03-15 |
公开(公告)号: | CN109949877A | 公开(公告)日: | 2019-06-28 |
发明(设计)人: | 万亚东;万建;张晓彤;李壮;王小芬;樊素超;李宇鹏 | 申请(专利权)人: | 北京科技大学 |
主分类号: | G16C20/90 | 分类号: | G16C20/90;G16C60/00 |
代理公司: | 北京市广友专利事务所有限责任公司 11237 | 代理人: | 张仲波 |
地址: | 100083*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 存储模板 构建 字段 科学实验数据 目标文件类型 抽取 数据融合 科学实验 过滤 材料领域 目标数据 数据转化 文件系统 预先设置 数据集 解析 数据库 转化 | ||
1.一种基于材料科学实验的数据融合方法,其特征在于,包括:
获取材料科学实验数据的存储模板,对所述存储模板进行解析,得到所述存储模板中包含的所有字段,从所述所有字段中提取要构建的字段,并获取要构建的目标文件类型;
连接至预先设置的数据库或者文件系统,将所述存储模板中所有字段的数据全部抽取出来;
根据提取得到的要构建的字段,对抽取的数据进行过滤;
根据获取的要构建的目标文件类型,将过滤后的数据转化为目标数据集。
2.根据权利要求1所述的基于材料科学实验的数据融合方法,其特征在于,所述获取材料科学实验数据的存储模板,对所述存储模板进行解析,得到所述存储模板中包含的所有字段包括:
从预先设置的模板系统中,获取材料科学实验数据的存储模板,其中,模板系统,用于存储材料科学实验数据的存储模板;或,接收用户手动创建的材料科学实验数据的存储模板;
确定所述存储模板的格式类型;
根据所述存储模板的格式类型,对所述存储模板进行数据解析操作,得到所述存储模板中包含的所有字段。
3.根据权利要求2所述的基于材料科学实验的数据融合方法,其特征在于,在得到所述存储模板中包含的所有字段之后,所述方法还包括:
将所有字段统一转为键值对描述的json格式。
4.根据权利要求1所述的基于材料科学实验的数据融合方法,其特征在于,所述连接至预先设置的数据库或者文件系统,将所述存储模板中所有字段的数据全部抽取出来包括:
连接至预先设置的数据库或者文件系统,检索所有基于所述存储模板存储的数据,利用抽取器将所述存储模板中所有字段的数据全部抽取出来;
其中,所述抽取器包括:文件系统连接器和数据库连接器;
所述文件系统连接器,用于连接至操作系统的文件系统;
所述数据库连接器,用于连接数据库。
5.根据权利要求4所述的基于材料科学实验的数据融合方法,其特征在于,所述数据库连接器包括:Postgresql连接器、MySQL连接器、MongoDB连接器、Oracle连接器、Redis连接器中的一个或多个;
Postgresql连接器用于连接postgresql数据库;
MySQL连接器用于连接MySQL数据库;
MongoDB连接器用于连接MongoDB数据库;
Oracle连接器用于连接Oracle数据库;
Redis连接器用于连接Redis数据库。
6.根据权利要求4所述的基于材料科学实验的数据融合方法,其特征在于,在抽取数据的过程中,对数据进行数据清洗操作,处理异常值和缺失值。
7.根据权利要求6所述的基于材料科学实验的数据融合方法,其特征在于,所述根据提取得到的要构建的字段,对抽取的数据进行过滤包括:
根据提取得到的要构建的字段,对清洗后的数据进行过滤,提取出要构建的字段数据进行数据重组,构造新的数据流对象。
8.根据权利要求7所述的基于材料科学实验的数据融合方法,其特征在于,所述获取要构建的目标文件类型包括:
从预先设置的目标文件类型集中,获取要构建的目标文件类型;
其中,所述目标文件类型集包括:xml、json、excel、csv、txt一种或多种目标文件类型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京科技大学,未经北京科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910197620.1/1.html,转载请声明来源钻瓜专利网。