[发明专利]一种基于词缀的用于对未知词进行语义分类的方法有效

专利信息
申请号: 201210361150.6 申请日: 2012-09-25
公开(公告)号: CN102929858A 公开(公告)日: 2013-02-13
发明(设计)人: 强彦;韩晓红;路景贵;赵涓涓;裴博;刘涛 申请(专利权)人: 太原理工大学
主分类号: G06F17/27 分类号: G06F17/27
代理公司: 暂无信息 代理人: 暂无信息
地址: 030024 *** 国省代码: 山西;14
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 词缀 用于 未知 进行 语义 分类 方法
【权利要求书】:

1.一种基于词缀的用于对未知词进行语义分类的方法,其特征在于,包括以下步骤:

对于用户输入的任一未知词w=AB,针对其词根A或B,在字典中查找与其具有相同词根的词作为该未知词的相似词,分析各个相似词的构词方式,对于不是有内容部分扩展而来的情况,根据同义词词林字典分析各个相似词的内容部分与该未知词的内容部分的相似度,将相似度为1的内容部分的相似词作为该未知词的语义类;对于各相似词是由其内容部分扩展而来的情况,认为该未知词也是由其内容部分扩展而来,此时只需要在同义词词林字典中查找出其内容部分的语义类,进而,将该语义类作为该未知词的语义类;对于词缀对其语义有较大影响的情况,根据同义词词林字典分别计算该未知词的内容部分与各相似词内容部分的语义类的相似度,并设定阈值,若其相似度大于该阈值则将其叠加在该相似词的内容部分的语义类的值上,筛选出语义类值最大的相似词的语义类作为该未知词的语义类。

2.如权利要求1所述方法,其特征在于,完全基于未知词的内容部分与相似词内容部分的相似度,其词缀部分对其语义类别没有影响的情况。

3.如权利要求1所述方法,其特征在于,对于计算未知词与相似词的内容部分的相似度,是完全基于相似词词林的语义类相似度计算的。

4.如权利要求1所述方法,其特征在于,对于未知词的相似词wr=AB,若C(wr)=C(B),其中C()表示该词的语义类,此时A为相似词wr和未知词w的词缀,在这种情况下,对于未知词可以很确信的将C(B)作为它的语义类,即C(w)=C(B)。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于太原理工大学,未经太原理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210361150.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top