[发明专利]使用语汇数据库用以命名萃取自文件组中的字汇群集和词组群集的方法、系统和计算机程序无效
申请号: | 03809753.2 | 申请日: | 2003-03-10 |
公开(公告)号: | CN1774713A | 公开(公告)日: | 2006-05-17 |
发明(设计)人: | 江昌·茂;舒密特·坦克;克莉丝蒂娜·庄;路克·艾尔发 | 申请(专利权)人: | 威乐提公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/21;G06F17/30 |
代理公司: | 隆天国际知识产权代理有限公司 | 代理人: | 王玉双;张浴月 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种使用语汇数据库用以命名萃取自文件组中的字汇群集和词组群集的方法、系统和计算机程序,其把这些群集当做输入,并且用语汇数据库(lexical database)产生合适的群集标签。命名的程序包括用语汇数据库(lexicaldatabase)来找出群集中所有字汇的所有可能的字义,接着,用语义上相似于该字义的字汇来增大每一个字义,以形成一个相对应的定义向量,之后,执行使字义清楚的步骤来找出对于每一个字汇最相关的字义,定义向量被群集成群,每一个群表示一个内容,接着,这些内容根据支撑而予以排序,最后从主要内容的定义向量中,根据在语汇数据库(lexical database)中的属性,选出一预先确认数量的字汇和词组来当做标签。 | ||
搜索关键词: | 使用 语汇 数据库 用以 命名 萃取 文件 中的 字汇 群集 词组 方法 系统 计算机 程序 | ||
【主权项】:
1.一种使用语汇数据库用以命名萃取自文件组中的字汇群集和词组群集的方法,其步骤包括有:a.使用语汇数据库,产生该群集中字汇的定义向量;b.决定该定义向量的支撑;c.决定对应于该群集中每一个字汇的最相关定义向量;d.使用一个预先选定的群集方法,从该最相关定义向量中产生内容;e.决定该内容的支撑;f.指定已预先决定数量的上层排序的该内容为主要内容;g.该主要内容尚未指定时,则由该群集中已预先决定数量的最常出现的字汇,来命名该群集;及h.当该主要内容已经指定时,则由语汇数据库中能正确详细描述该主要内容的字汇选出,来命名该群集。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于威乐提公司,未经威乐提公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/03809753.2/,转载请声明来源钻瓜专利网。
- 上一篇:制造双极型半导体元件的方法和相应的双极型半导体元件
- 下一篇:双极晶体管