[发明专利]一种基于同义词扩展的贝叶斯词义消歧方法在审
申请号: | 201611157518.1 | 申请日: | 2016-12-15 |
公开(公告)号: | CN106598947A | 公开(公告)日: | 2017-04-26 |
发明(设计)人: | 杨陟卓;张虎;李茹;陈千;谭红叶 | 申请(专利权)人: | 山西大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06K9/62 |
代理公司: | 山西五维专利事务所(有限公司)14105 | 代理人: | 郭海燕 |
地址: | 030006 山*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于自然语言处理方法技术领域,具体地说,涉及一种基于同义词扩展的贝叶斯词义消歧方法。本发明主要解决当前的词义消歧方法存在消歧效果差、获取消歧知识费时费力等问题。本发明一种基于同义词扩展的贝叶斯词义消歧方法,包括以下步骤步骤1、采用同义词词林将训练语料库的上下文进行扩展,生成大量伪训练语料;步骤2、利用词语搭配语料库去除伪训练语料中的噪声,生成伪训练语料库;步骤3、同时采用训练语料库和伪训练语料库训练贝叶斯消歧模型;步骤4、将测试语料输入贝叶斯消歧模型,综合利用两种语料库中的消歧知识,共同决策歧义词的词义。 | ||
搜索关键词: | 一种 基于 同义词 扩展 贝叶斯 词义 方法 | ||
【主权项】:
一种基于同义词扩展的贝叶斯词义消歧方法,其特征在于包括以下步骤:步骤1、采用同义词词林将训练语料库的上下文进行扩展,生成大量伪训练语料;步骤2、利用词语搭配语料库去除伪训练语料中的噪声,生成伪训练语料库;步骤3、同时采用训练语料库和伪训练语料库训练贝叶斯消歧模型;步骤4、将测试语料输入贝叶斯消歧模型,综合利用两种语料库中的消歧知识,共同决策歧义词的词义。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山西大学,未经山西大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611157518.1/,转载请声明来源钻瓜专利网。