[发明专利]一种基于MST算法的越南语依存树库构建方法在审
申请号: | 201610063686.8 | 申请日: | 2016-01-29 |
公开(公告)号: | CN105740234A | 公开(公告)日: | 2016-07-06 |
发明(设计)人: | 郭剑毅;李发杰;余正涛;线岩团;毛存礼;文永华 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 650093 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 mst 算法 越南语 依存 构建 方法 | ||
1.一种基于MST算法的越南语依存树库构建方法,其特征在于:所述基于MST算法的越南语依存树库构建方法的具体步骤如下:
Step1、首先构建越南语依存树库训练语料库;
Step2、利用越南语依存树库训练语料库的训练语料训练得到MST模型,再利用MST模型训练越南语句子得到越南语依存树库;
Step3、对得到的越南语依存树库语料库进行校正。
2.根据权利要求1所述的基于MST算法的越南语依存树库构建方法,其特征在于:所述步骤Step1中,构建越南语依存树库训练语料库的具体步骤为:
Step1.1、首先对汉越平行句对进行词对齐处理,得到汉越词对齐平行句对库;
Step1.2、对汉越词对齐平行句对库进行中文句子依存句法分析处理得到中文依存树语料库;
Step1.3、把构建好的中文依存树语料库中的中文依存关系通过汉越词对齐平行句对库映射到越南语的句子中去,从而得到越南语依存树库训练语料库。
3.根据权利要求1所述的基于MST算法的越南语依存树库构建方法,其特征在于:所述步骤Step2的具体步骤为:
Step2.1、利用得到的越南语依存树库训练语料库的训练语料使用MST算法训练得到MST模型;
Step2.2、利用MST模型训练越南语句子得到越南语依存树库。
4.根据权利要求1所述的基于MST算法的越南语依存树库构建方法,其特征在于:所述步骤Step3中,对得到的越南语依存树库的语料进行校正的具体步骤为:
Step3.1、首先分析总结依存树库中存在的错误的分类,然后将这些错误进行分析和整理,为后面的校正做准备;
Step3.2、利用依存关系校正器对越南语依存树库进行校正。
5.根据权利要求1所述的基于MST算法的越南语依存树库构建方法,其特征在于:所述步骤Step3中,对得到的越南语依存树库的语料进行校正的具体方法为:利用依存关系校正器对得到的越南语依存树库的语料进行校正。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610063686.8/1.html,转载请声明来源钻瓜专利网。