[发明专利]用于对未知词进行语义分类的系统和方法无效

申请号：	200910006527.4	申请日：	2009-02-04
公开（公告）号：	CN101794281A	公开（公告）日：	2010-08-04
发明（设计）人：	赵凯;胡长建;邱立坤	申请（专利权）人：	日电(中国)有限公司
主分类号：	G06F17/27	分类号：	G06F17/27
代理公司：	北京东方亿思知识产权代理有限责任公司 11258	代理人：	宋鹤;南霆
地址：	100007 北京市东城区东四十***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明提出了用于对未知词进行语义分类的系统和方法。根据第一方法，字典中针对每个词根的相似词集合根据不同的语义类被分成多个群组，并将包含相似词最多的群组的语义类记录下来，用于未知词的分类。根据第二方法，字典中的每个语义类所包含的各个单字符对被考查。如果由某一字符对扩展得到的单词是相似词(即语义类相同)，则可以更加确信地将该未知词分类到同样的语义类。根据第三方法，所输入的未知词的相似词被考查。如果其相似词的不同部分与完整相似词具有相同的语义类，则可以更加确信地将该未知词也分类到同样的语义类。根据本发明的语义分类方法和系统能够适用于包含任何字符数目的单词，因此可以实现更大的覆盖率和更高的分类精确度。
搜索关键词：	用于未知进行语义分类系统方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种用于对未知词进行语义分类的方法，包括：针对字典中的每个词根A，收集包含该词根A的相似词集合{AD1，AD2，...ADn}或{D1A，D2A，...DnA}，其中所述词根A包含一个或多个字符，Di(i＝1，2，...，n)包含一个或多个字符并且满足C(D1)＝C(D2)＝...＝C(Dn)＝c，其中C()表示语义类，c指示一特定语义类，n表示集合中相似词的数目，n≥2；按照不同的语义类，对所收集的每个相似词集合{AD1，AD2，...ADn}或{D1A，D2A，...DnA}中的相似词进行分组，以使得每个群组中的相似词具有相同的语义类；记录所含相似词数目最多的群组的语义类cmax；输入一未知词w＝XY，其中X和Y各自包含一个或多个字符；从所收集的各个相似词集合中选择其词根A满足A＝X或A＝Y的相似词集合；以及对于所选的相似词集合，若满足A＝X且C(Y)＝c或者A＝Y且C(X)＝c，则将该未知词w分类到针对该词根A所记录的语义类cmax。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于日电(中国)有限公司，未经日电(中国)有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/200910006527.4/，转载请声明来源钻瓜专利网。

上一篇：一种制备聚阴离子型锂离子电池正极材料的方法
下一篇：一维漫反射随机折射率梯度覆层及其应用

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]用于对未知词进行语义分类的系统和方法无效

专利文献下载