[发明专利]结合兼类词词性消歧模型和字典的越南语词性标记方法在审
申请号: | 201711056063.9 | 申请日: | 2017-11-01 |
公开(公告)号: | CN107894977A | 公开(公告)日: | 2018-04-10 |
发明(设计)人: | 郭剑毅;赵晨;余正涛;王红斌;文永华 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 650093 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及结合兼类词词性消歧模型和字典的越南语词性标记方法,属于自然语言处理技术领域。本发明首先通过整理越南语字典为基础得到非兼类词字典和兼类词字典;其次根据越南语特点,选取越南语词性标注特征,形成兼类词词性消歧模型;再根据兼类词词性消歧模型和非兼类词字典分别对测试语料中的兼类词和非兼类词进行词性标记;最后将两种标记的结果进行融合得到最终标记结果。本发明特别考虑了兼类词对词性标注的影响,有效地提高越南语的词性标注的正确率。 | ||
搜索关键词: | 结合 兼类词 词性 模型 字典 越南语 标记 方法 | ||
【主权项】:
结合兼类词词性消歧模型和字典的越南语词性标记方法,其特征在于:所述方法的具体步骤为:Step1、首先人工整理得到越南语字典;Step2、其次以人工整理的越南语字典为基础得到非兼类词字典和兼类词字典;Step3、其次根据越南语语言特点,选取了越南语词性标注特征集,构造了兼类词词性消歧模型;Step4、再根据所构建的兼类词词性消歧模型和非兼类词字典分别对在越南语新闻网上获取的测试语料中的兼类词和非兼类词自动进行词性标记;Step5、最后将两种标记的结果进行自动融合得到最终标记结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711056063.9/,转载请声明来源钻瓜专利网。
- 上一篇:一种基于Bi‑LSTM的混合语料分词方法
- 下一篇:时间词的抽取方法及装置