[发明专利]字矩阵的训练方法及装置有效
申请号: | 201911083289.7 | 申请日: | 2019-11-07 |
公开(公告)号: | CN110765779B | 公开(公告)日: | 2023-09-29 |
发明(设计)人: | 周慧超;王冉;李东军 | 申请(专利权)人: | 苏州跃盟信息科技有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/289 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 梁文惠 |
地址: | 215123 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 矩阵 训练 方法 装置 | ||
1.一种字矩阵的训练方法,其特征在于,包括:
获取目标语句的字向量以及与所述字向量对应的字矩阵;
依据近语义模型和近义语料数据对所述字矩阵进行训练,得到第一训练结果;
依据反语义模型和反义语料数据对所述第一训练结果进行训练,得到第二训练结果;
输出所述第二训练结果中确定的目标字矩阵;
依据近语义模型和近义语料数据对所述字矩阵进行训练,得到第一训练结果,包括:
获取所述近义语料数据中的第一语句和第二语句;
依据所述近语义模型通过将所述第一语句中的所述字矩阵进行乘法运算得到第一语义矩阵,以及将所述第二语句中的所述字矩阵进行乘法运算得到第二语义矩阵。
2.根据权利要求1所述的方法,其特征在于,通过以下方式获取所述目标语句的字向量:
预先从文本语料数据中获取所述目标语句;
依据词向量产生模型对所述目标语句中的待训练字向量进行训练处理,得到所述字向量。
3.根据权利要求2所述的方法,其特征在于,在获取目标语句的字向量以及与所述字向量对应的字矩阵之前,所述方法还包括:
预先定义所述目标字矩阵的矩阵大小;
通过对所述目标语句中每个字对应的待训练字向量进行初始化处理,得到初始化后的所述待训练字向量,其中,所述待训练字向量的向量维数与所述目标字矩阵的矩阵大小存在对应关系,所述向量维数为完全平方数。
4.根据权利要求1所述的方法,其特征在于,
在获取目标语句的字向量以及与所述字向量对应的字矩阵之前,所述方法还包括:预先定义所述目标字矩阵的目标训练次数;
在获取目标语句的字向量以及与所述字向量对应的字矩阵之前,所述方法还包括:预先定义所述目标字矩阵的目标训练次数;在输出所述第二训练结果中确定的目标字矩阵之前,所述方法还包括:获取所述目标字矩阵的当前训练次数,所述当前训练次数的初始值为0;比较所述当前训练次数是否小于所述目标训练次数,得到比较结果;若所述比较结果指示所述当前训练次数小于所述目标训练次数,则返回执行获取目标语句的字向量以及与所述字向量对应的字矩阵的步骤;若所述比较结果指示所述当前训练次数大于或等于所述目标训练次数,则执行输出所述第二训练结果中确定的目标字矩阵的步骤。
5.根据权利要求1所述的方法,其特征在于,依据近语义模型和近义语料数据对所述字矩阵进行训练,得到第一训练结果,包括:
确定所述第一语义矩阵和所述第二语义矩阵之间的第一矩阵差异值;
依据所述第一矩阵差异值调整所述字向量,得到所述第一训练结果,其中,所述第一训练结果至少包括:调整所述字向量得到的第一字向量。
6.根据权利要求5所述的方法,其特征在于,依据反语义模型和反义语料数据对所述第一训练结果进行训练,得到第二训练结果,包括:
获取所述反义语料数据中的第三语句和第四语句;
依据所述反语义模型通过将所述第三语句中的所述字矩阵进行乘法运算得到第三语义矩阵,以及将所述第四语句中的所述字矩阵进行乘法运算得到第四语义矩阵;
依据所述第三语义矩阵和所述第四语义矩阵调整所述第一字向量,得到所述第二训练结果,其中,所述第二训练结果至少包括:调整所述第一字向量得到的第二字向量。
7.根据权利要求6所述的方法,其特征在于,依据所述第三语义矩阵和所述第四语义矩阵调整所述第一字向量,得到所述第二训练结果,包括:
将所述第三语义矩阵转换得到第一语义向量,将所述第四语义矩阵转换得到第二语义向量;
确定所述第一语义向量和所述第二语义向量的余弦值;
依据所述余弦值确定所述第三语义矩阵和所述第四语义矩阵之间的第二矩阵差异值;
依据所述第二矩阵差异值调整所述第一字向量,得到所述第二训练结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州跃盟信息科技有限公司,未经苏州跃盟信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911083289.7/1.html,转载请声明来源钻瓜专利网。