[发明专利]半监督文本简化模型训练方法和系统在审
申请号: | 201910744141.7 | 申请日: | 2019-08-13 |
公开(公告)号: | CN110427629A | 公开(公告)日: | 2019-11-08 |
发明(设计)人: | 俞凯;赵晏彬 | 申请(专利权)人: | 苏州思必驰信息科技有限公司;上海交通大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 黄谦;邓婷婷 |
地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开半监督文本简化模型训练方法和系统,其中,方法包括:建立复杂句到简单句的转化模型Comp2Simp和简单句到复杂句的回译模型Simp2Comp;分别对Comp2Simp和Simp2Comp进行初始化;利用初始化后的Simp2Comp构造第一平行语料对,利用初始化后的Comp2Simp构造第二平行语料对;利用第一平行语料对对初始化后的Comp2Simp的进行有监督训练,利用第二平行语料对对初始化后的Simp2Comp的进行有监督训练,从而完成第一轮迭代;分别利用参数更新后的Simp2Comp和Comp2Simp重复执行上述构造平行语料对和更新模型参数的过程完成后续迭代。 | ||
搜索关键词: | 初始化 语料 平行 简化模型 半监督 文本 参数更新 过程完成 后续迭代 模型参数 重复执行 迭代 监督 更新 转化 | ||
【主权项】:
1.一种半监督文本简化模型训练方法,包括:建立复杂句到简单句的转化模型Comp2Simp和简单句到复杂句的回译模型Simp2Comp;分别对Comp2Simp和Simp2Comp进行初始化;利用初始化后的模型Simp2Comp将简单句x转化为复杂句C(x)以构造第一平行语料对(C(x),x),利用初始化后的模型Comp2Simp将复杂句y转化为对应的简单句S(y)以构造第二平行语料对(S(y),y);利用所述第一平行语料对(C(x),x)对初始化后的模型Comp2Simp的进行有监督训练以更新模型Comp2Simp的参数,利用所述第二平行语料对(S(y),y)对初始化后的模型Simp2Comp的进行有监督训练以更新模型Simp2Comp的参数,从而完成第一轮迭代;分别利用参数更新后的Simp2Comp和参数更新后的Comp2Simp重复执行上述构造平行语料对和更新模型参数的过程完成后续迭代。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州思必驰信息科技有限公司;上海交通大学,未经苏州思必驰信息科技有限公司;上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910744141.7/,转载请声明来源钻瓜专利网。