[发明专利]模型数据处理方法、装置、电子设备和存储介质在审
申请号: | 202210234415.X | 申请日: | 2022-03-10 |
公开(公告)号: | CN114625440A | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | 汪达胜;沈丽忠;陈晗 | 申请(专利权)人: | 中国建设银行股份有限公司 |
主分类号: | G06F9/445 | 分类号: | G06F9/445 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 张春晓;郝红玉 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 数据处理 方法 装置 电子设备 存储 介质 | ||
1.一种模型数据处理方法,其特征在于,包括:
响应于模型构建请求,获取所述模型构建请求中模型类型,以基于所述模型类型查询对应的模型组件库,其中,所述模型组件库中包括数据源组件集合、数据预处理组件集合和模型训练组件集合;
获取模型描述信息,调用预设识别模型,以识别所述模型描述信息中数据来源标识、数据预处理算法标识和模型算法标识,进而分别从所述模型组件库中查询对应的数据源组件、数据预处理组件和模型训练组件;
调用预设的模型组合模板,将所述数据源组件、所述数据预处理组件和所述模型训练组件组合,得出目标模型。
2.根据权利要求1所述的方法,其特征在于,所述预设识别模型包括关键词识别模型;
识别所述模型描述信息中数据来源标识、数据预处理算法标识和模型算法标识,包括:
基于预设的数据来源词库识别所述模型描述信息中数据来源标识,基于所述数据预处理算法词库识别所述模型描述信息中数据预处理算法标识;基于所述模型算法词库识别所述模型描述信息中模型算法标识。
3.根据权利要求1所述的方法,其特征在于,调用预设的模型组合模板,将所述数据源组件、所述数据处理组件和所述模型训练组件组合,得出目标模型,包括:
查询所述数据源组件、所述数据处理组件和所述模型训练组件分别对应的数据输入接口和结果输出接口;
将所述数据输入接口和结果输出接口,更新至模型组合模板;
基于更新后的模型组合模板、所述数据源组件、所述数据处理组件和所述模型训练组件,生成目标模型。
4.根据权利要求1所述的方法,其特征在于,所述分别从模型组件库中查询对应的数据源组件、数据预处理组件和模型训练组件,包括:
查询所述模型类型对应的历史模型,获取所述历史模型的数据源组件、数据预处理组件和模型训练组件;
判断所述历史模型的数据源组件、数据预处理组件和模型训练组件是否分别与所述数据来源标识、数据预处理算法标识和模型算法标识匹配;
若是,则将所述历史模型确定为所述目标模型;若否,则分别从模型组件库中查询对应的数据源组件、数据预处理组件和模型训练组件。
5.根据权利要求4所述的方法,其特征在于,分别从所述模型组件库中查询对应的数据源组件、数据预处理组件和模型训练组件,包括:
获取所述历史模型的数据源组件与所述数据来源标识的第一匹配结果、所述历史模型的数据预处理组件与所述数据预处理算法标识的第二匹配结果和所述历史模型的模型训练组件和模型算法标识的第三匹配结果;
判断所述第一匹配结果、所述第二匹配结果和所述第三匹配结果中匹配结果为匹配成功的数量是否大于预设阈值;
若否,则分别从模型组件库中查询对应的数据源组件、数据预处理组件和模型训练组件;若是,则基于不为匹配成功的匹配结果,确定所述历史模型中待更新组件,以从所述模型组件库中查询目标组件,替换所述待更新组件,将替换后的历史模型确定为所述目标模型。
6.根据权利要求1所述的方法,其特征在于,将所述数据源组件、所述数据预处理组件和所述模型训练组件组合,得出目标模型之后,还包括:
接收模型训练请求,获取所述运行请求中数据源标识;
调用所述目标模型,以基于所述数据源标识读取训练数据,并得出数据处理结果;
判断所述数据处理结果是否满足预设训练条件;
若是,则输出训练后的目标模型;若否,则调整所述目标模型中组件参数,调用调整后的目标模型,以得出新的数据处理结果,直到所述新的数据处理结果满足所述预设训练条件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国建设银行股份有限公司,未经中国建设银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210234415.X/1.html,转载请声明来源钻瓜专利网。