[发明专利]一种GloVe超参数调优方法有效
申请号: | 201811218356.7 | 申请日: | 2018-10-18 |
公开(公告)号: | CN109508455B | 公开(公告)日: | 2021-11-19 |
发明(设计)人: | 牛倩;曹学飞;王瑞波;李济洪 | 申请(专利权)人: | 山西大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06N20/00 |
代理公司: | 太原晋科知识产权代理事务所(特殊普通合伙) 14110 | 代理人: | 任林芳 |
地址: | 030006*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 glove 参数 方法 | ||
1.一种GloVe超参数调优方法,其特征在于:包括以下步骤,
S101~将GloVe模型,即式3中的超参数作为可控因子,要求每个可控因子至少有两个可取值,即水平,
式中|V|是词表的大小,即词表内所有词的总数目;Xij表示目标词i和窗口内的其他词j在语料中的共现频次,bi和分别是词i和词j的偏置项,β为校正因子;
S102~将GloVe模型训练中不易控制的因子作为噪声因子;
S103~每次迭代计算最优水平组合的过程中,可控因子选择当前最优水平和候选水平,共两个水平,噪声因子选择全部水平;
S104~对步骤S103中选出的所有因子的不同水平进行组合,以信噪比snk作为方差分析模型的指标,进行方差分析以及显著性检验;步骤S104包括以下方法,对步骤S103中选出的所有因子的不同水平进行组合,基于式3训练模型,得到词表征向量,然后在评测任务上得到相应的准确率p,为适应方差分析的显著性检验,把p进行logistics变换为y=ln(p/(1-p));对所有可控因子的任一种水平组合,在所有噪声因子的水平组合上评测得到一组准确率的变换值y,记yi(k)为对第k组中第i个评测结果,按计算每组信噪比snk,其中nk为第k组的评测结果个数,即全部噪声因子的水平组合,以信噪比snk作为方差分析模型的指标,进行方差分析以及显著性检验;
S105~分析每一个可控因子fi,如果fi显著,则替换最优水平lie为对应信噪比snk较大的水平作为当前最优水平;
S106~重复执行步骤S103-S105,直到所有可控因子Li中所有可取值,即水平,都被探测过为止,此时由各可控因子最优水平组成的组合即为优化组合,也即超参数的最终取值。
2.根据权利要求1所述的GloVe超参数调优方法,其特征在于:所述步骤S101中,所有可控因子集记为F={f1,f2,f3,f4,f5,f6},包括
f1:语料规模大小,其可取值,即水平,记为L1={l1i|i=1,2,…,c1};
f2:上下文窗口大小,其可取值,即水平,记为L2={l2i|i=1,2,…,c2};
f3:词表征的向量维度大小,其可取值,即水平,记为L3={l3i|i=1,2,…,c3};
f4:随机初始向量的取值范围,其可取值,即水平,记为L4={l4i|i=1,2,…,c4};
f5:迭代次数,其可取值,即水平,记为L5={l5i|i=1,2,…,c5};
f6:校正因子β,用来校正Xij的分布,其可取值,即水平,记为L6={l6i|i=1,2,…,c6}。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山西大学,未经山西大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811218356.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种短信审核方法及装置
- 下一篇:一种文本处理方法和装置