[发明专利]一种利用计算机对词义进行排歧的方法、系统及检索方法有效
申请号: | 200810117907.0 | 申请日: | 2008-08-05 |
公开(公告)号: | CN101334768A | 公开(公告)日: | 2008-12-31 |
发明(设计)人: | 刘飞;潘小双;吴明辉;迟松涛 | 申请(专利权)人: | 北京学之途网络科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
代理公司: | 北京安信方达知识产权代理有限公司 | 代理人: | 龙洪;朱振德 |
地址: | 100085北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种利用计算机对词义进行排歧的方法、系统及检索方法。本发明利用歧义词的背景特征词对歧义词每个义项的贡献度来确定歧义词的涵义,计算机可以自己对排歧进行学习。本发明排歧的实现方法简单且容易理解并且是十分有效的。通过实验表明,对于系统关注的词义排歧,平均准确率可以达到90%以上。同时,对比其他歧义排除方法,此方法运行速度很快并且系统容易实现。本发明的检索方法可以只展示给用户与用户输入关键词涵义相同的检索结果,大大提高了检索效率。 | ||
搜索关键词: | 一种 利用 计算机 词义 进行 方法 系统 检索 | ||
【主权项】:
1、一种计算机处理语言时对词义进行排歧的方法,包括:建立包含多篇文章的文章库,根据词语词义词典对所述文章中各词汇的词义进行标注,每一词汇具有一个或多个词义选项即义项;对每一词汇,确定该词汇的背景特征词以及每一背景特征词对于该词汇各义项的权重;对于待分析文本中需进行排歧的歧义词,确定该待分析文本中包含的该歧义词的背景特征词,然后对该歧义词的每个义项,分别计算出所述背景特征词对于该义项的权重之和;根据各义项的权重之和选择一个义项作为该歧义词的词义。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京学之途网络科技有限公司,未经北京学之途网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200810117907.0/,转载请声明来源钻瓜专利网。
- 上一篇:杠杆拱型文件夹机构和包括该机构的杠杆拱型文件夹
- 下一篇:色度补偿方法和装置