[发明专利]一种基于树库转化的越南语依存树库错误检测的方法在审
申请号: | 201810021822.6 | 申请日: | 2018-01-10 |
公开(公告)号: | CN108280060A | 公开(公告)日: | 2018-07-13 |
发明(设计)人: | 郭剑毅;邱国柯;余正涛;线岩团;毛存礼 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 650093 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于树库转化的越南语依存树库错误检测的方法,属于自然语言处理技术领域。本发明包括如下步骤:首先定义越南语的依存关系类型;其次构建一个规则知识库,并利用该规则知识库推导出测试依存结构树中父节点和子节点构成的短语类型;然后将测试依存结构树转化为短语结构树;最后将实际转化成功得到的短语结构树的短语类型与推导出的短语类型进行对比。本发明能够对越南语的机器翻译、信息抽取和信息检索等上层应用提供有力支撑;可以有效提高越南语依存树库的质量;节省了人力物力的时间;为越南语依存树库错误检测提供了一种有效的方法。 | ||
搜索关键词: | 越南语 错误检测 短语类型 规则知识库 短语结构 树库转化 依存结构 推导 自然语言处理技术 机器翻译 测试 人力物力 上层应用 信息抽取 信息检索 依存关系 父节点 子节点 构建 转化 支撑 成功 | ||
【主权项】:
1.一种基于树库转化的越南语依存树库错误检测的方法,其特征在于:所述方法的具体步骤如下:Step1、首先定义越南语的依存关系类型;Step2、其次利用Step1的结果构建一个规则知识库,并利用该规则知识库推导出测试依存结构树中父节点和子节点构成的短语类型;Step3、然后将测试依存结构树转化为短语结构树;若转化失败,则直接说明测试依存结构树中最基础的分词与词性标注错误;若转化成功,则进入Step4;Step4、最后将Step3中实际转化成功得到的短语结构树的短语类型与Step2中推导出的短语类型进行对比;若对比一致,则说明测试依存结构树不存在错误;若对比不一致,则说明测试依存结构树中最基础的分词与词性标注正确,而更上层的依存关系标注错误。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810021822.6/,转载请声明来源钻瓜专利网。