[发明专利]为程序合成训练模型的方法和装置在审
申请号: | 202211395470.3 | 申请日: | 2022-11-09 |
公开(公告)号: | CN116266109A | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 托德·A·安德森;周圣天;加维尔·图雷克;席琳·李;贾斯汀·戈特施利希 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F8/20 | 分类号: | G06F8/20;G06N3/0455;G06N3/0442;G06N3/0464;G06N3/126 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 李丽 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 程序 合成 训练 模型 方法 装置 | ||
1.一种装置,包括:
至少一个存储器;
指令;以及
处理器电路,用来执行所述指令以:
对程序的配对采样,所述程序的配对包括第一程序和第二程序,所述第一程序包括自然语言描述,
计算与所述程序的配对相对应的程序相似性得分,并且
基于与所述程序的配对中的一些配对相对应的条目来训练模型,所述条目中的至少一个条目包括:
所述自然语言描述中的相应一个和所述第二程序中与之配对的一个,以及
所述程序相似性得分中的相应一个。
2.如权利要求1中限定的装置,其中,所述条目还包括与所述第二程序中的一个配对的所述第一程序中的相应一个。
3.如权利要求1中限定的装置,其中,所述处理器电路执行所述指令以利用遗传算法生成所述第二程序。
4.如权利要求1到3中任一项中限定的装置,其中,所述处理器电路执行所述指令以进一步基于输入或者与所述输入相关联的输出中的至少一者来训练所述模型。
5.如权利要求4中限定的装置,其中,所述条目中的一些条目还包括所述输入和所述输出,所述输出是通过将所述输入提供给所述第一程序或所述第二程序中的至少一者之一来生成的。
6.如权利要求1中限定的装置,其中,所述处理器电路执行所述指令以过滤所述程序的配对。
7.如权利要求6中限定的装置,其中,所述处理器电路执行所述指令以通过移除所述程序的配对中具有优势得分的那些配对来过滤所述程序的配对。
8.如权利要求1、6或7中任一项中限定的装置,其中,所述处理器电路执行所述指令以经由代码语义相似性算法计算所述程序相似性得分。
9.如权利要求1中限定的装置,其中,所述处理器电路执行所述指令以利用长短期记忆(LSTM)神经网络来训练所述模型。
10.如权利要求9中限定的装置,其中,所述LSTM神经网络是双向LSTM训练网络。
11.一种非暂态计算机可读介质,包括指令,所述指令当被执行时,使得至少一个处理器:
对程序的配对采样,所述程序的配对包括第一程序和第二程序,所述第一程序包括自然语言描述;
计算与所述程序的配对相对应的程序相似性得分;并且
基于与所述程序的配对中的一些配对相对应的条目来训练模型,所述条目中的至少一个条目包括:
所述自然语言描述中的相应一个和所述第二程序中与之配对的一个,以及
所述程序相似性得分中的相应一个。
12.如权利要求11中限定的计算机可读介质,其中,所述条目中的一些条目还包括与所述第二程序中的一个配对的所述第一程序中的相应一个。
13.如权利要求11或12中任一项中限定的计算机可读介质,其中,所述指令使得所述至少一个处理器利用遗传算法来生成所述第二程序。
14.如权利要求11或12中任一项中限定的计算机可读介质,其中,所述指令使得所述至少一个处理器进一步基于输入或者与所述输入相关联的输出中的至少一者来训练所述模型。
15.如权利要求14中限定的计算机可读介质,其中,所述条目中的一些条目还包括所述输入和所述输出,所述输出是通过将所述输入提供给所述第一程序或所述第二程序中的至少一者之一来生成的。
16.如权利要求11中限定的计算机可读介质,其中,所述指令使得所述至少一个处理器过滤所述程序的配对。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211395470.3/1.html,转载请声明来源钻瓜专利网。