[发明专利]一种模型参数训练方法及装置有效
申请号: | 201610968965.9 | 申请日: | 2016-11-03 |
公开(公告)号: | CN108021985B | 公开(公告)日: | 2022-05-10 |
发明(设计)人: | 吉宗诚;王君保;郭祥;郭瑞;雷宇 | 申请(专利权)人: | 北京如布科技有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06K9/62 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆;胡彬 |
地址: | 100089 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模型 参数 训练 方法 装置 | ||
1.一种模型参数训练方法,其特征在于,所述模型参数用于识别口语化文本,所述方法包括:
获取口语化文本样本数据集合和根据所述口语化文本样本数据集合进行预测的数据模型,所述口语化文本样本数据集合包括已标注口语化文本样本和未标注口语化文本样本,所述数据模型包括初始化的第一参数V的向量和第二参数U的向量;
对于已标注口语化文本样本集合DL中的每一个已标注口语化文本样本:由所述已标注口语化文本样本的第一特征向量Φv及所述第一参数V算出第一预测结果y1,当所述第一预测结果y1与所述已标注口语化文本样本的标注不一致时,更新所述第一参数V;由所述已标注口语化文本样本的第二特征向量Φu及所述第二参数U算出第二预测结果y2,当所述第二预测结果y2与所述已标注口语化文本样本的标注不一致时,更新所述第二参数U;重复上述两过程直到所有已标注口语化文本样本都被使用;
对于未标注口语化文本样本集合DU中的每一个未标注口语化文本样本:由所述未标注口语化文本样本的第二特征向量Φu’及所述第二参数U算出第三预测结果z3,由所述未标注口语化文本样本的第一特征向量Φv’及所述第一参数V算出第四预测结果z4,当所述第三预测结果z3跟所述第四预测结果z4不一致时,更新所述第二参数U以及更新所述第一参数V,重复此过程直到所有未标注口语化文本样本都被使用;
其中,所述第一参数V与所述第二参数U用于从口语化文本中识别出实体名;
所述第一参数V为向量wv,所述第二参数U为向量wu,所述初始化所述第一参数V和所述第二参数U为将所述第一参数V和所述第二参数U置为0向量,所述已标注口语化文本样本为(x,y),所述未标注口语化文本样本为z;对某一候选预测结果表示所有可能的预测结果集合,所述已标注口语化文本样本的第一特征向量Φv为Φv(x,y′),所述已标注口语化文本样本的第二特征向量Φu为Φu(x,y′);对某一候选预测结果表示所有可能的预测结果集合,所述未标注口语化文本样本的第二特征向量Φu’为Φu(z,y′),所述未标注口语化文本样本的第一特征向量Φv’为Φv(z,y′);
所述第一预测结果y1通过如下公式计算:
所述第二预测结果y2通过如下公式计算:
所述第三预测结果z3通过如下公式计算:
所述第四预测结果z4通过如下公式计算:
当所述第一预测结果y1与所述已标注口语化文本样本的标注不一致时,更新所述第一参数V包括:更新后的第一参数V的向量=wv+Φv(x,y)-Φv(x,y1);
当所述第二预测结果y2与所述已标注口语化文本样本的标注不一致时,更新所述第二参数U包括:更新后的第二参数U的向量=wu+Φu(x,y)-Φu(x,y2);
当所述第三预测结果z3跟所述第四预测结果z4不一致时,更新所述第二参数U包括:更新后的同时更新所述第一参数V包括:更新后的
其中
λ、n及m为常数。
2.一种模型参数训练装置,其特征在于,所述模型参数用于识别口语化文本,所述装置包括:
获取模块,用于获取口语化文本样本数据集合和根据所述口语化文本样本数据集合进行预测的数据模型,所述口语化文本样本数据集合包括已标注口语化文本样本和未标注口语化文本样本,所述数据模型包括初始化的第一参数V的向量和第二参数U的向量;
第一训练模块,与所述获取模块相连,用于对于已标注口语化文本样本集合DL中的每一个已标注口语化文本样本:由所述已标注口语化文本样本的第一特征向量Φv及所述第一参数V算出第一预测结果y1,当所述第一预测结果y1与所述已标注口语化文本样本的标注不一致时,更新所述第一参数V;由所述已标注口语化文本样本的第二特征向量Φu及所述第二参数U算出第二预测结果y2,当所述第二预测结果y2与所述已标注口语化文本样本的标注不一致时,更新所述第二参数U;重复上述两过程直到所有已标注口语化文本样本的标注都被使用;
第二训练模块,与所述第一训练模块相连,用于对于未标注口语化文本样本集合DU中的每一个未标注口语化文本样本:由所述未标注口语化文本样本的第二特征向量Φu’及所述第二参数U算出第三预测结果z3,由所述未标注口语化文本样本的第一特征向量Φv’及所述第一参数V算出第四预测结果z4,当所述第三预测结果z3跟所述第四预测结果z4不一致时,更新所述第二参数U以及更新所述第一参数V,重复此过程直到所有未标注样本都被使用;
其中,所述第一参数V与所述第二参数U用于从口语化文本中识别出实体名;
所述第一参数V为向量wv,所述第二参数U为向量wu,所述初始化所述第一参数V和所述第二参数U为将所述第一参数V和所述第二参数U置为0向量,所述已标注口语化文本样本为(x,y),所述未标注口语化文本样本为z;对某一候选预测结果表示所有可能的预测结果集合,所述已标注口语化文本样本的第一特征向量Φv为Φv(x,y′),所述已标注口语化文本样本的第二特征向量Φu为Φu(x,y′);对某一候选预测结果表示所有可能的预测结果集合,所述未标注口语化文本样本的第二特征向量Φu为Φu(z,y′),所述未标注口语化文本样本的第一特征向量Φv为Φv(z,y′)。
所述第一预测结果y1通过如下公式计算:
所述第二预测结果y2通过如下公式计算:
所述第三预测结果z3通过如下公式计算:
所述第四预测结果z4通过如下公式计算:
当所述第一预测结果y1与所述已标注口语化文本样本的标注不一致时,更新所述第一参数V包括:更新后的第一参数V的向量=wv+Φv(x,y)-Φv(x,y1);
当所述第二预测结果y2与所述已标注口语化文本样本的标注不一致时,更新所述第二参数U包括:更新后的第二参数U的向量=wu+Φu(x,y)-Φu(x,y2);
当所述第三预测结果z3跟所述第四预测结果z4不一致时,更新所述第二参数U包括:更新后的同时更新所述第一参数V包括:更新后的
其中
λ、n及m为常数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京如布科技有限公司,未经北京如布科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610968965.9/1.html,转载请声明来源钻瓜专利网。