[发明专利]一种基于语言模型的韩语分词还原方法在审

申请号：	201911323649.6	申请日：	2019-12-20
公开（公告）号：	CN111178060A	公开（公告）日：	2020-05-19
发明（设计）人：	杜权;徐萍;朱靖波;肖桐;张春良	申请（专利权）人：	沈阳雅译网络技术有限公司
主分类号：	G06F40/284	分类号：	G06F40/284;G06F40/42
代理公司：	沈阳优普达知识产权代理事务所(特殊普通合伙) 21234	代理人：	李晓光
地址：	110004 辽宁省***	国省代码：	辽宁;21
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开一种基于语言模型的韩语分词还原方法，包括以下步骤：1)语言模型训练：使用Unigram的方法对韩语单语数据进行语言模型训练，得到一个韩语的语言模型用于后续分词还原操作；2)双语数据分词：训练一个翻译系统，使用分词工具对双语训练数据进行分词；3)翻译模型训练：使用步骤1)生成的语言模型对数据进行分词处理后，将分词后的数据输入到神经网络模型中开始训练模型至模型收敛；4)译文分词还原：使用步骤3)训练得到的翻译系统对测试语句进行翻译，将得到的韩语译文合并为标准韩语的书写方式。本发明能够缓解韩语数据中单词含义颗粒度较大、数据稀疏等问题，有效提高了目标语为韩语的机器翻译的译文质量。
搜索关键词：	一种基于语言模型韩语分词还原方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

暂无信息

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于沈阳雅译网络技术有限公司，未经沈阳雅译网络技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201911323649.6/，转载请声明来源钻瓜专利网。

上一篇：一种面向子词切分的BPE-Learn加速方法
下一篇：一种基于离散型注意力机制的神经机器翻译解码加速方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于语言模型的韩语分词还原方法在审

专利文献下载