[发明专利]自文件集合中自动搜寻概念层次结构的方法及系统无效
申请号: | 03816761.1 | 申请日: | 2003-05-15 |
公开(公告)号: | CN1669029A | 公开(公告)日: | 2005-09-14 |
发明(设计)人: | 克莉丝蒂娜·庄;刘静慧;艾尔发·路克;江昌·茂;舒密特·坦克;凡希·弗吐库鲁 | 申请(专利权)人: | 威乐提公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/20;G06F17/22;G06F17/27 |
代理公司: | 隆天国际知识产权代理有限公司 | 代理人: | 张龙哺;王玉双 |
地址: | 美国加*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种可自一文件集合中自动搜寻概念并自动生成一概念层次结构(310)的方法、系统及计算机程序。该方法包括:自文件集合中抽取特征字符(304);利用统计方法计算特征字符间的相似度(306);提炼特征字符的分布频率以使上述相似度计算趋于精确(508);对特征字符进行语义排歧以解决意义分歧的问题;以经提炼的分布频率及语义排歧后的特征字符为基础,重新计算特征字符的相似度(510)。经再次计算所得的相似度可反映各特征字符间的实际相似程度,藉此,可将相关的特征字符进行聚类形成不同的概念,所得概念排列为一个概念层次结构。该概念层次结构可自动对某一待检索的特定概念产生询问并返回与该概念相关的文件。 | ||
搜索关键词: | 文件 集合 自动 搜寻 概念 层次 结构 方法 系统 | ||
【主权项】:
1.一种自文件库中自动搜寻概念层级的方法,该概念层级将概念组织为多个抽象级别,该方法包括:从文件库中提取特征;判定所述特征之间相似性;逐级聚类相关特征以生成概念,由此得出逐层聚类的概念,从而产生一个概念层级;标注该概念层级中的概念;以及为所产生的概念层级创建一个界面。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于威乐提公司,未经威乐提公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/03816761.1/,转载请声明来源钻瓜专利网。