[发明专利]基于可视化的代码识别模型训练方法及装置在审
申请号: | 202011586098.5 | 申请日: | 2020-12-28 |
公开(公告)号: | CN114691111A | 公开(公告)日: | 2022-07-01 |
发明(设计)人: | 刘晓娟;李兆军;尹非凡 | 申请(专利权)人: | 北京三快在线科技有限公司 |
主分类号: | G06F8/34 | 分类号: | G06F8/34;G06N20/00 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 任亚娟 |
地址: | 100083 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 可视化 代码 识别 模型 训练 方法 装置 | ||
1.一种基于可视化的代码识别模型训练方法,其特征在于,包括:
显示模型配置页面;
获取用户在所述模型配置页面内输入的模型训练模式、模型网络结构和超参数;
获取与所述模型网络结构匹配的待训练代码识别模型;
根据所述模型训练模式,获取预先保存的所述待训练代码识别模型对应的代码训练样本;
加载所述超参数,并根据所述代码训练样本对所述待训练代码识别模型进行训练。
2.根据权利要求1所述的方法,其特征在于,在所述加载所述超参数,并根据所述代码训练样本对所述待训练代码识别模型进行训练之前,还包括:
获取所述用户在所述模型配置页面内输入的模型输入参数和模型输出参数;
所述加载所述超参数,并根据所述代码训练样本对所述待训练代码识别模型进行训练,包括:
根据所述模型输入参数,将所述代码训练样本输入至所述待训练代码识别模型;
根据所述模型输出参数,获取由所述待训练代码识别模型输出的所述代码训练样本对应的代码预测结果;
根据所述代码训练样本对应的初始代码结果和所述代码预测结果,计算得到所述待训练代码识别模型对应的损失值;
在所述损失值处于预设范围内的情况下,将训练后的代码识别模型作为最终的目标代码识别模型。
3.根据权利要求2所述的方法,其特征在于,在所述加载所述超参数,并根据所述代码训练样本对所述待训练代码识别模型进行训练之前,还包括:
获取所述用户在所述模型配置页面内输入的损失函数类型;
所述根据所述代码训练样本对应的初始代码结果和所述代码预测结果,计算得到所述待训练代码识别模型对应的损失值,包括:
根据所述初始代码结果和所述代码预测结果,计算得到所述待训练代码识别模型对应的与所述损失函数类型匹配的损失值。
4.根据权利要求2所述的方法,其特征在于,在所述根据所述代码训练样本对应的初始代码结果和所述代码预测结果,计算得到所述待训练代码识别模型对应的损失值之后,还包括:
在所述损失值处于所述预设范围外的情况下,获取所述损失值对应的损失梯度;
根据所述损失梯度调整所述超参数,得到目标超参数;
加载所述目标超参数,根据所述代码训练样本,迭代执行对所述待训练代码识别模型的训练过程,直至所述待训练代码识别模型对应的损失值处于所述预设范围内。
5.根据权利要求2所述的方法,其特征在于,在所述加载所述超参数,并根据所述代码训练样本对所述待训练代码识别模型进行训练之前,还包括:
校验所述模型输入参数、所述模型输出参数和所述超参数的配置有效性;
在所述配置有效性不满足模型训练条件的情况下,生成配置错误提示信息;
将所述配置错误提示信息发送给所述用户,以由所述用户根据所述配置错误提示信息对所述模型输入参数、和/或所述模型输出参数、和/或所述超参数重新进行配置。
6.根据权利要求1所述的方法,其特征在于,所述加载所述超参数,并根据所述代码训练样本对所述待训练代码识别模型进行训练,包括:
对所述超参数进行赋值,得到赋值超参数;
加载所述赋值超参数,并根据所述代码训练样本对所述待训练代码识别模型进行训练。
7.根据权利要求1所述的方法,其特征在于,在所述加载所述超参数,并根据所述代码训练样本对所述待训练代码识别模型进行训练之前,还包括:
获取所述用户在所述模型配置页面内输入的钩子函数;
所述根据所述代码训练样本对所述待训练代码识别模型进行训练,包括:
在根据所述代码训练样本对所述待训练代码识别模型的训练过程中,自动加载所述钩子函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011586098.5/1.html,转载请声明来源钻瓜专利网。