[发明专利]语料扩充方法及系统在审
申请号: | 201910808605.6 | 申请日: | 2019-08-29 |
公开(公告)号: | CN112528680A | 公开(公告)日: | 2021-03-19 |
发明(设计)人: | 王驹冬;李霞;丁庆;李小华 | 申请(专利权)人: | 上海卓繁信息技术股份有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/42;G06N3/08 |
代理公司: | 上海容慧专利代理事务所(普通合伙) 31287 | 代理人: | 于晓菁 |
地址: | 200030 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明一种语料扩充方法及系统,包括:搜集中文语料和对应的英文语料,对中文语料进行分词处理,对英文语料和分词后的中文语料进行文本量化;构建包括英译汉模型和汉译英模型的翻译模型;将量化后的中文语料和英文语料分别作为汉译英模型的输入和输出训练模型,将量化后的英文语料和中文语料分别作为英译汉模型的输入和输出训练模型;搜集中文用户问话,将中文用户问话作为训练好的汉译英模型的输入以输出英文翻译结果;将英文翻译结果作为对抗生成网络的输入以输出扩充英文生成结果;将扩充英文生成结果作为训练好的英译汉模型的输入以输出扩充中文翻译结果,从而达到语料扩充的目的。 | ||
搜索关键词: | 语料 扩充 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海卓繁信息技术股份有限公司,未经上海卓繁信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910808605.6/,转载请声明来源钻瓜专利网。