[发明专利]多尺度集成可视化的高通量自动计算流程及数据智能系统有效
申请号: | 202010907586.5 | 申请日: | 2020-09-02 |
公开(公告)号: | CN112102887B | 公开(公告)日: | 2023-02-24 |
发明(设计)人: | 孙志梅;王冠杰;彭力宇;李开旗;祝令刚;缪奶华;周健 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G16C10/00 | 分类号: | G16C10/00;G16C20/30;G16C20/80 |
代理公司: | 北京航智知识产权代理事务所(普通合伙) 11668 | 代理人: | 黄川;史继颖 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 尺度 集成 可视化 通量 自动 计算 流程 数据 智能 系统 | ||
1.一种多尺度集成可视化的高通量自动计算数据智能系统,其特征在于,包括如下子系统:材料建模系统、科学计算系统、服务器配置系统、数据存储系统、数据分析系统和人工智能系统;
所述材料建模系统包括晶体建模模块、高通量容器和高通量容器控件,所述晶体建模模块用于通过一种或多种方式构建初始晶体结构并将其传入所述高通量容器;所述高通量容器控件用于对传入的所有初始晶体结构进行高通量筛选,通过判断晶体结构的有效性和重复性,获得有效晶体结构;
所述科学计算系统包括VASP第一性原理高通量工作流模块、LAMMPS分子动力学高通量工作流模块、OpenPhase相图模拟高通量工作流模块、动力学相关高通量工作流模块和热力学高通量工作流模块;所述VASP第一性原理高通量工作流模块用于为有效晶体结构指定基于VASP软件的计算模拟任务,并基于所指定的计算模拟任务构建一个或多个高通量工作流;所述LAMMPS分子动力学高通量工作流模块用于为有效晶体结构指定基于LAMMPS软件的计算模拟任务,并基于所指定的计算模拟任务构建一个或多个高通量工作流;所述OpenPhase相图模拟高通量工作流模块用于为有效晶体结构指定基于OpenPhase软件的计算模拟任务,并基于所指定的计算模拟任务构建一个或多个高通量工作流;所述动力学相关高通量工作流模块用于为有效晶体结构指定基于KMC软件的计算模拟任务,并基于所指定的计算模拟任务构建一个或多个高通量工作流;热力学科学计算工作模块用于为有效晶体结构指定基于Gibbs和Tc软件的计算模拟任务,并基于所指定的计算模拟任务构建一个或多个高通量工作流;
所述服务器配置系统包括服务器管理模块和服务器状态模块;所述服务器管理模块用于配置远程服务器参数、计算节点及运行状态,以及用于将所构建的一个或多个高通量工作流自动发送至所述数据存储系统;所述服务器状态模块用于为每个高通量工作流设定并分配远程服务器计算资源并启动远程工作;
所述数据存储系统包括共享数据库、隐私数据库和数据库控件;所述共享数据库用于多用户之间的数据共享;所述隐私数据库包括结构子数据库、任务子数据库、性能子数据库和文件子数据库,所述结构子数据库用于存储高通量工作流计算过程中涉及到的初始晶体结构和经过所述科学计算系统的高通量工作流模块优化后的晶体结构;所述任务子数据库用于存储高通量工作流计算过程中的计算流程及中间元数据;所述性能子数据库用于保存高通量工作流计算过程中的与材料基础性能相关的数值;所述文件子数据库用于存储高通量工作流计算过程中大于10M的数据文件;所述数据库控件用于为存储在所述任务子数据库中的每个高通量工作流添加所述远程服务器参数,以及用于存储高通量工作流的输入配置和计算过程流程图;
所述数据分析系统包括数据检索模块和数据分析及可视化模块;所述数据检索模块用于检索查询所述结构子数据库中的晶体结构信息、所述任务子数据库中的计算流程和所述性能子数据库中的与材料基础性能相关的数值,并传送至所述分析及可视化模块进行数据分析;所述数据分析及可视化模块用于对查询到的晶体结构信息、计算流程和与材料基础性能相关的数值进行统计学、散点图、分布图,能带图和态密度图分析,并可视化作图查看;
所述人工智能系统包括智能纠错模块和数据挖掘模块,所述智能纠错模块用于自动检测每个高通量工作流中当前计算模拟任务可能出现的报错情况,在最大纠正次数允许的范围内进行自动纠错,之后把纠错后的当前计算模拟任务自动提交到计算队列进行计算,并将所有纠错过程存储于所述任务子数据库和将纠错结果存储于所述性能子数据库;所述数据挖掘模块用于结合机器学习技术对晶体结构计算数据进行数据预处理、构建机器学习模型以及模型参数训练、数据挖掘和材料性能分析及预测;
所述晶体建模模块包括POSCAR控件、Builder控件、Two Doping控件、Multi POSCAR控件、Finder控件和Build Heterojunction控件中的一个或多个;
所述POSCAR控件用于导入单个初始晶体结构;
所述Builder控件用于构建晶界结构、空位结构和间隙结构;
所述Two Doping控件用于构建双掺杂或者共掺杂结构;
所述MultiPOSCAR控件用于导入多个初始晶体结构;
所述Finder控件用于从所述结构子数据库导入所需的初始晶体结构;
所述Build Heterojunction控件用于构建异质结结构;
所述数据挖掘模块包括Xsf控件、Fingerprint控件、Generate控件、Train控件、TrainAccurcyPlot控件、Potential控件和PMAnalyzer控件中的一个或多个;
所述Xsf控件用于将计算完成的晶体结构转换为包含原子能量和原子受力的XSF格式的数据文件;
所述Fingerprint控件用于载入机器学习数据生成过程中所需的数学方程的参数;
所述Generate控件用于将所述数学方程应用到所述XSF格式的数据文件中,产生适用于机器学习的初始数据;
所述Train控件用于构建机器学习模型以及模型训练过程中的超参数配置,并根据反向传播算法进行机器学习模型和超参数的训练;
所述TrainAccurcyPlot控件用于机器学习训练精度及收敛性的分析;
所述Potential控件用于将训练完成的机器学习模型保存为可以进行材料结构性能预测和大规模分子动力学模拟的势函数文件;
所述PMAnalyzer控件用于机器学习预测过程的数据分析;
所述晶体建模模块支持多种构建复杂晶体结构的方式:
a)通过POSCAR控件输入单个晶体结构文件,其自动识别“*poscar*”文件格式的结构,其中每个晶体结构被解析为以下几部分:缩放系数,晶格矢量vector,原子个数及坐标,通过公式(1)求解对应的倒易空间矢量;
yicell=2π((xcell)-1)T (1)
其中,yicell表示晶体结构在倒易空间的晶格矢量;xcell表示晶体结构在直角坐标系中的晶格矢量;
b)通过MultiPOSCAR控件输入多个晶体结构文件,支持的文件格式包括CIF文件,XSF文件,XYZ文件,DATA文件以及POSCAR文件,每一类晶体结构通过不同的解析器最终被解析为与a)相同的部分;
c)通过Builder控件构建空位结构、掺杂结构、间隙结构及晶界结构;
d)通过Finder控件在现有的18万条结构数据中查询目标晶体结构;
e)通过数据分析系统的分析模块中的Viewer控件的多个可视化窗口,以树状的形式添加结构信息至可视化界面,对于MultiPOSCAR控件,在可视化界面中选择对应标号展示对应信息;
所述高通量容器控件(HTProcessor)通过结构预处理算法,筛选有效晶体结构和重复晶体结构:
a)首先通过下式(2)判断晶体结构的有效性,其中,ytrue表示该晶体结构中是否为有效晶体结构,N表示晶体结构的原子个数,n表示遍历从1到N个原子,为每个原子运算fall函数,fall表示判断每个位点是否被完全占据的函数,occupy表示晶体结构中每个位点占据的比例,当ytrue的值与原子个数N相同则判定为晶体结构有效,否则判定为无效,删除对应的晶体结构;
b)根据每个有效晶体结构中原子个数、晶格矢量、倒易矢量及原子位置信息,筛选并去除重复的晶体结构。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010907586.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种起绒布面料以及制备工艺
- 下一篇:一种石墨烯浆料专用高剪切研磨分散系统