[发明专利]一种自动求解数学题的伪对偶学习方法在审
申请号: | 202310395869.X | 申请日: | 2023-04-13 |
公开(公告)号: | CN116402162A | 公开(公告)日: | 2023-07-07 |
发明(设计)人: | 杨阳;宾燚;史文浩;韩孟群 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06F17/18;G06F17/10;G06N3/0442;G06N3/084;G06F17/16 |
代理公司: | 成都行之智信知识产权代理有限公司 51256 | 代理人: | 温利平 |
地址: | 611173 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自动 求解 数学题 对偶 学习方法 | ||
1.一种自动求解数学题的伪对偶学习方法,其特征在于,包括以下步骤:
(1)、获得预测表达式
对于一个包含N个单词的待求解数学题P={w1,w2,...,wN}输入到数学题自动求解器中进行自动求解,得到由数字集合Q、算符和常数组成预测表达式S={s1,s2,...,sK},其中,wn表示第n个单词,n=1,2,…,N,数字Q={q1,q2,...,qM},qm表示第m个数字,m=1,2,…,M,sk表示第k个表达式元素;
数学题自动求解器包含一个数学题编码器和一个表达式解码生成器,待求解数学题P输入数学题编码器,获得待求解数学题P的语义特征Ep,语义特征Ep再输入到表达式解码生成器按最大概率输出预测表达式S,即满足:
其中,Pr表示取到字符sk的概率值,Θen和Θdec分别数学题编码器和表达式解码生成器的学习参数;
(2)、数字填充
2.1)、对预测表达式S进行重采样,获得预测表达式S的连续近似值
2.2)、将连续近似值Sg输入到表达式编码器得到预测表达式S的语义特征Eg,将待求解数学题P正确的目标表达式输入到表达式编码器得到目标表达式St的语义特征Et;
2.3)、从语义特征Eg中取出预测表达式S中数字的语义特征从语义特征Et中取出目标表达式St中数字的语义特征然后进行加权求和,得到计划融合后的表达式数字语义特征
Ef_num=εEt_num+(1-ε)Eg_num
其中,权重ε来调整两部分的比例,ε随着训练优化过程从1指数衰减到0;
从语义特征Ep中取出数学问题中数字的语义特征其中,表示M×D维的实数空间,D是表达式编码器隐层的维度大小;
2.4)、利用一个指针网络计算待求解数学题P中第m个数字与预测表达式S中M个数字相匹配的概率分布向量:
其中,概率分布向量为Probm为M维度,为语义特征Ep中的第m行,W1、W2为指针网络的学习权重矩阵,u为列权重向量;
这样得到待求解数学题P中M个数字与预测表达式S中M个数字相匹配的概率分布向量的集合{Prob1,Prob2,...,ProbM};
(3)、训练优化
3.1)、在训练优化过程中,对于数学题自动求解器,正确的目标表达式St作为监督信号与预测表达式S之间计算得到负对数似然损失函数LG;
对于数字填充,待求解数学题P中数字qm的标签为当其在对应预测表达式S中位于第j个位置时,om的第j维值为1,其他维值为0,对应填充损失函数计算如下:
3.2)、构建损失函数L=LG+LI,通过最小化损失函数L来训练优化数学题自动求解器,从而完成伪对偶学习。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310395869.X/1.html,转载请声明来源钻瓜专利网。