[发明专利]一种贵金属材料数据文件自动化提取系统及方法在审
申请号: | 202111247547.8 | 申请日: | 2021-10-26 |
公开(公告)号: | CN114036926A | 公开(公告)日: | 2022-02-11 |
发明(设计)人: | 陈力;张爱敏;崔浩;陈家林;王建强;郭俊梅;王卓;王者 | 申请(专利权)人: | 昆明贵研新材料科技有限公司;成都材智科技有限公司 |
主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F40/186;G06F16/25 |
代理公司: | 北京喆翙知识产权代理有限公司 11616 | 代理人: | 胡文强 |
地址: | 650000 云南省昆*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 贵金属 材料 数据文件 自动化 提取 系统 方法 | ||
1.一种贵金属材料数据文件自动化提取系统,其特征在于,包括解析插件模块、解析模板模块、文件格式化模块,
所述解析插件模块:寻找可以解析从贵金属行业实验生产中产生的电子文档数据文件的解析插件,通过解析插件对数据文件进行解析;
所述解析模板模块:寻找可以将解析出的数据映射到贵金属材料数据库中的解析模板,并通过解析模板对该贵金属材料数据文件进行解析;
所述文件格式化模块:对解析后的贵金属材料数据文件格式进行判断,对符合标准的数据文件格式进行贵金属材料结构化数据提取,获得贵金属材料结构化数据。
2.根据权利要求1所述的贵金属材料数据文件自动化提取系统,其特征在于,所述解析插件中每一种插件负责一类贵金属材料数据文件的解析,解析插件会针对贵金属材料数据做处理逻辑。
3.根据权利要求2所述的贵金属材料数据文件自动化提取系统,其特征在于,所述解析插件的处理逻辑方式为:读取特定贵金属材料数据格式、对贵金属性能数据做出重组和简单计算统计操作。
4.根据权利要求1所述的贵金属材料数据文件自动化提取系统,其特征在于,所述解析插件模块中对于不存在可以解析的数据文件的解析插件,则通过人工导入适配该文件数据的解析插件。
5.根据权利要求1所述的贵金属材料数据文件自动化提取系统,其特征在于,所述解析模板中每一种模板负责解析结果与贵金属材料数据库的数据一一产生映射关系,当解析结果存在多种映射时,创建多个贵金属材料数据文件解析模板。
6.根据权利要求1所述的贵金属材料数据文件自动化提取系统,其特征在于,所述文件格式化模块中对于不同数据文件采用不同的提取方式提取,并获得数据文本中的数据信息。
7.根据权利要求6所述的贵金属材料数据文件自动化提取系统,其特征在于,所述文件格式化模块中,当数据文件无法匹配到对应模板,则直接反馈扫描位置与扫描项目,并通过人工判断,对反馈的贵金属材料数据文件进行修改、或对贵金属材料数据文件解析插件进行修改。
8.根据权利要求1-7任一项所述的贵金属材料数据文件自动化提取系统的方法,其特征在于,包括以下步骤:
S1、收集贵金属行业实验生产中产生的电子文档数据;
S2、对收集到的贵金属材料数据文件进行解析插件读取,寻找是否存在可以解析该类贵金属材料数据文件的解析插件,如果不存在该解析插件,则人工导入针对该类贵金属材料数据文件的新解析插件,如果存在则通过解析插件解析出半结构化数据;
S3、寻找是否存在可以将解析出的半结构化数据映射到贵金属材料数据库的贵金属材料数据文件解析模板,通过存在的解析模块为解析插件解析出的数据完成数据到数据库的一对一映射;
S4、对解析后的贵金属材料数据文件进行数据文件格式扫描,获得贵金属材料结构化数据,并存储在贵金属材料数据库中。
9.根据权利要求8所述的贵金属材料数据文件自动化提取系统的方法,其特征在于,所述S3中,当解析出的半结构化数据无法匹配对应的解析模板,则需要重新选择贵金属材料数据文件、或者重新设置贵金属材料的解析插件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明贵研新材料科技有限公司;成都材智科技有限公司,未经昆明贵研新材料科技有限公司;成都材智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111247547.8/1.html,转载请声明来源钻瓜专利网。