[发明专利]一种GloVe超参数调优方法有效

专利信息
申请号: 201811218356.7 申请日: 2018-10-18
公开(公告)号: CN109508455B 公开(公告)日: 2021-11-19
发明(设计)人: 牛倩;曹学飞;王瑞波;李济洪 申请(专利权)人: 山西大学
主分类号: G06F40/30 分类号: G06F40/30;G06N20/00
代理公司: 太原晋科知识产权代理事务所(特殊普通合伙) 14110 代理人: 任林芳
地址: 030006*** 国省代码: 山西;14
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 glove 参数 方法
【权利要求书】:

1.一种GloVe超参数调优方法,其特征在于:包括以下步骤,

S101~将GloVe模型,即式3中的超参数作为可控因子,要求每个可控因子至少有两个可取值,即水平,

式中|V|是词表的大小,即词表内所有词的总数目;Xij表示目标词i和窗口内的其他词j在语料中的共现频次,bi和分别是词i和词j的偏置项,β为校正因子;

S102~将GloVe模型训练中不易控制的因子作为噪声因子;

S103~每次迭代计算最优水平组合的过程中,可控因子选择当前最优水平和候选水平,共两个水平,噪声因子选择全部水平;

S104~对步骤S103中选出的所有因子的不同水平进行组合,以信噪比snk作为方差分析模型的指标,进行方差分析以及显著性检验;步骤S104包括以下方法,对步骤S103中选出的所有因子的不同水平进行组合,基于式3训练模型,得到词表征向量,然后在评测任务上得到相应的准确率p,为适应方差分析的显著性检验,把p进行logistics变换为y=ln(p/(1-p));对所有可控因子的任一种水平组合,在所有噪声因子的水平组合上评测得到一组准确率的变换值y,记yi(k)为对第k组中第i个评测结果,按计算每组信噪比snk,其中nk为第k组的评测结果个数,即全部噪声因子的水平组合,以信噪比snk作为方差分析模型的指标,进行方差分析以及显著性检验;

S105~分析每一个可控因子fi,如果fi显著,则替换最优水平lie为对应信噪比snk较大的水平作为当前最优水平;

S106~重复执行步骤S103-S105,直到所有可控因子Li中所有可取值,即水平,都被探测过为止,此时由各可控因子最优水平组成的组合即为优化组合,也即超参数的最终取值。

2.根据权利要求1所述的GloVe超参数调优方法,其特征在于:所述步骤S101中,所有可控因子集记为F={f1,f2,f3,f4,f5,f6},包括

f1:语料规模大小,其可取值,即水平,记为L1={l1i|i=1,2,…,c1};

f2:上下文窗口大小,其可取值,即水平,记为L2={l2i|i=1,2,…,c2};

f3:词表征的向量维度大小,其可取值,即水平,记为L3={l3i|i=1,2,…,c3};

f4:随机初始向量的取值范围,其可取值,即水平,记为L4={l4i|i=1,2,…,c4};

f5:迭代次数,其可取值,即水平,记为L5={l5i|i=1,2,…,c5};

f6:校正因子β,用来校正Xij的分布,其可取值,即水平,记为L6={l6i|i=1,2,…,c6}。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山西大学,未经山西大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811218356.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top