[发明专利]一种基于标签的文件呈现方法及其系统有效
申请号: | 200810106158.1 | 申请日: | 2008-05-09 |
公开(公告)号: | CN101286175A | 公开(公告)日: | 2008-10-15 |
发明(设计)人: | 朱广飞;王衡;汪国平;程惠阁 | 申请(专利权)人: | 北京大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 北京君尚知识产权代理事务所 | 代理人: | 余长江 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 标签 文件 呈现 方法 及其 系统 | ||
1.一种基于标签的文件呈现方法,其步骤为:
1)利用单词判定模块对输入的标签集合进行单词提取;
2)利用多义词判定模块判断出上述单词中的多义词单词并提示用户设定该多义词单词的具体含义;
3)利用近义词判定模块将单词划分为若干近义词集合;
4)利用图元生成模块将标签中单词属于同一近义词集合的文件呈现为同一图元。
2.如权利要求1所述的方法,其特征在于所述单词包括但不限于下列单词的一种或几种:
英文单词、中文单词。
3.如权利要求1所述的方法,其特征在于所述标签为短语时,提取单词的方法为将短语分割为单词,且每个单词都保持原来标签的所有属性;所述标签中的单词为英文单词时,采用Porter的填充算法消除单词的单复数、时态。
4.如权利要求1所述的方法,其特征在于所述多义词判定模块内包含一多义词字典,所述多义词判定模块的工作方法为:
1)采用WordNet多义词字典判断出每一个所述单词是否为多义词;
2)对于多义词单词提示用户选定其中的某一项含义;
3)将所选定的含义作为该单词所属标签的附加内容添加到文件的标签中。
5.如权利要求1所述的方法,其特征在于所述近义词判定模块的判定方法为:
1)计算全部所述单词之间的相似度;
2)判断所述相似度值是否大于设定阈值;
3)将单词间相似度不小于设定阈值的单词划分到同一近义词集合。
6.如权利要求1所述的方法,其特征在于所述标签为图结构呈现标签。
7.如权利要求1所述的方法,其特征在于所述图元的属性包括:大小、位置、颜色和形状。
8.如权利要求7所述的方法,其特征在于设定标签所映射文件的数量参数num、文件点击频率参数frq,根据公式size=num+frq计算所述图元大小;根据用户交互历史记录确定所述图元的颜色、形状。
9.一种基于标签的文件呈现系统,其包括
单词判定模块,用于对输入的标签集合进行单词提取,得到标签中的单词;
多义词判定模块,用于判断单词中的多义词单词并提示用户设定多义词单词的具体含义;
近义词判定模块,用于将单词划分为若干近义词集合;
图元生成模块,用于将标签中单词属于同一近义词集合的文件呈现为同一图元。
10.如权利要求9所述的系统,其特征在于所述单词判定模块包括短语处理子模块和单词处理子模块;所述多义词判定模块包括单词查找子模块和多义词字典;所述近义词判定模块包括相似度计算子模块和近义词分类子模块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810106158.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种丙烯照片的冲洗方法
- 下一篇:一种延胡索季铵总碱及其制备方法