[发明专利]编程语言翻译模型的训练方法、装置、设备及存储介质有效
申请号: | 202110021389.8 | 申请日: | 2021-01-08 |
公开(公告)号: | CN112346737B | 公开(公告)日: | 2021-04-13 |
发明(设计)人: | 刘玉;徐国强 | 申请(专利权)人: | 深圳壹账通智能科技有限公司 |
主分类号: | G06F8/51 | 分类号: | G06F8/51 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 编程 语言 翻译 模型 训练 方法 装置 设备 存储 介质 | ||
1.一种编程语言翻译模型的训练方法,其特征在于,所述编程语言翻译模型包括编码层和解码层,所述编码层包括第一编码层和第二编码层,所述编程语言翻译模型通过第一解答代码集和第二解答代码集训练得到,所述第一解答代码集和所述第二解答代码集一一对应,所述第一解答代码集中每个第一解答代码的编程语言为第一编程语言,所述第二解答代码集中每个第二解答代码的编程语言为第二编程语言,所述第一编程语言不同于所述第二编程语言,所述方法包括:
针对所述第一解答代码集中每个第一解答代码,将所述第一解答代码输入所述第一编码层,以通过所述第一编码层对所述第一解答代码中的每个单词进行编码,得到所述第一解答代码中每个单词对应的第一特征向量;
针对所述第二解答代码集中每个第二解答代码,将所述第二解答代码输入所述第二编码层,以通过所述第二编码层对所述第二解答代码中的每个单词进行编码,得到所述第二解答代码中每个单词对应的第二特征向量;
将所述第一解答代码中每个单词对应的第一特征向量和所述第二解答代码中对应单词的第二特征向量输入所述解码层,以预测所述第一解答代码对应的代码翻译结果;
根据所述第一解答代码对应的代码翻译结果,调整所述编程语言翻译模型的模型参数,以对所述编程语言翻译模型进行训练;
在针对所述第一解答代码集中每个第一解答代码,将所述第一解答代码输入所述第一编码层,以通过所述第一编码层对所述第一解答代码中的每个单词进行编码,得到所述第一解答代码中每个单词对应的第一特征向量之前,所述方法还包括:
通过网络爬虫从互联网中获取N个编程题中每个编程题对应的M个解答代码以及M个标签,所述N和所述M均为大于0的整数,所述M个解答代码和所述M个标签一一对应,所述M个标签中的每个标签用于指示所述M个解答代码中每个解答代码所采用的编程语言;
根据所述N个编程题中每个编程题对应的所述M个标签,从所述N个编程题中每个编程题对应的所述M个解答代码中,确定编程语言为所述第一编程语言的第一解答代码集和编程语言为所述第二编程语言的第二解答代码集。
2.根据权利要求1所述的方法,其特征在于,所述N个编程题中的一个编程题为第一编程题,所述根据所述N个编程题中每个编程题对应的所述M个标签,从所述N个编程题中每个编程题对应的所述M个解答代码中,确定编程语言为所述第一编程语言的第一解答代码集和编程语言为所述第二编程语言的第二解答代码集,包括:
根据所述第一编程题对应的M个标签,从所述第一编程题对应的所述M个解答代码中,选择第三解答代码,所述第三解答代码为所述第一解答代码集中任意一个代码;
根据所述第一编程题对应的M-1个标签,从所述第一编程题对应的M-1个解答代码中,选择第四解答代码,所述第一编程题对应的M-1个标签为所述第一编程题对应的所述M个标签中除所述第三解答代码对应的标签之外的其他标签,所述第一编程题对应的所述M-1个解答代码为所述第一编程题对应的所述M个解答代码中除所述第三解答代码之外的其他解答代码,所述第四解答代码为所述第二解答代码集中与所述第三解答代码对应的解答代码。
3.根据权利要求1所述的方法,其特征在于,所述第一解答代码包括K个单词,所述K为大于0的整数,所述将所述第一解答代码中每个单词对应的第一特征向量和所述第二解答代码中对应单词的第二特征向量输入所述解码层,以预测所述第一解答代码对应的代码翻译结果,包括:
S1:设置i的初始值为1;
S2:若所述i小于或等于所述K,则执行步骤S3;若所述i大于所述K,则执行步骤S6;
S3:将所述第一解答代码中第i个单词对应的第一特征向量和所述第二解答代码中对应单词的第二特征向量输入所述解码层中,以预测所述第i个单词对应的代码翻译结果,其中,所述解码层包括第一隐向量和第二隐向量,所述第一隐向量是根据所述第一解答代码中所有单词的上下文信息确定的,所述第二隐向量是根据所述第二解答代码中所有单词的上下文信息确定的;
S4:将所述第i个单词对应的代码翻译结果保存在代码翻译结果库中;
S5:令i=i+1,返回执行步骤S2;
S6:从所述代码翻译结果库中,获取所述第一解答代码中每个单词对应的代码翻译结果,将所述第一解答代码中每个单词对应的代码翻译结果进行映射,以得到所述第一解答代码对应的代码翻译结果;
S7:结束预测所述第一解答代码对应的代码翻译结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳壹账通智能科技有限公司,未经深圳壹账通智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110021389.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于区块链的气瓶数据记录方法及记录装置
- 下一篇:一种热铆焊接设备