[发明专利]用于网络文件的多维索引的方法和设备有效
申请号: | 201010192559.0 | 申请日: | 2010-06-01 |
公开(公告)号: | CN102270201A | 公开(公告)日: | 2011-12-07 |
发明(设计)人: | 葛付江;王主龙;孟遥;于浩;贾文杰;何楠;贾晓建;王新文 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 朱胜;陈炜 |
地址: | 日本神*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 网络 文件 多维 索引 方法 设备 | ||
1.一种为文档建立索引的方法,包括:
识别构成所述文档的特征;
将所述特征中的每一个的维度分类为主维度、次维度和附加维度中之一;
针对所述主维度的特征和所述次维度的特征建立扩展的倒排索引,所述扩展的倒排索引中包含所述次维度的特征;
针对所述附加维度的特征建立倒排索引;
将针对所述主维度的特征和所述次维度的特征建立的扩展的倒排索引与针对所述附加维度的特征建立的倒排索引相结合,得到复合索引;以及
将所述复合索引存储到索引储存库中。
2.根据权利要求1所述的方法,其中,针对所述主维度的特征和所述次维度的特征建立扩展的倒排索引包括:针对所述主维度的特征建立一维索引,并且在所述一维索引中附加所述次维度的特征。
3.根据权利要求1所述的方法,其中,针对所述附加维度的特征建立的倒排索引为多维索引。
4.一种对文档进行检索的方法,包括:
将用户所输入的特征中的每一个的维度识别为主维度、次维度和附加维度中之一;
根据识别的所述维度将用户所输入的特征构造为具有复合索引的特征检索结构;以及
在执行根据权利要求1-3中任何一项所述的方法而得到的索引储存库中进行检索,以检索出具有所述特征检索结构的文档。
5.一种为文档建立索引的设备,包括:
识别装置,用于识别构成所述文档的特征;
分类装置,用于将所述识别装置所识别的特征中的每一个的维度分类为主维度、次维度和附加维度中之一;
主维度与次维度索引装置,用于针对所述主维度的特征和所述次维度的特征建立扩展的倒排索引,所述扩展的倒排索引中包含所述次维度的特征;
附加维度索引装置,用于针对所述附加维度的特征建立倒排索引;
复合索引装置,用于将通过所述主维度与次维度索引装置针对所述主维度的特征和所述次维度的特征建立的扩展的倒排索引与通过所述附加维度索引装置针对所述附加维度的特征建立的倒排索引相结合,得到复合索引;以及
索引储存库,用于存储通过所述复合索引装置得到的复合索引。
6.根据权利要求5所述的设备,其中,所述主维度与次维度索引装置针对所述主维度中的每一个的特征建立一维索引,并且在所述一维索引中附加所述次维度的特征,以获得所述扩展的倒排索引。
7.根据权利要求5所述的设备,其中,所述附加维度索引装置针对所述附加维度的特征建立的倒排索引为多维索引。
8.一种对文档进行检索的设备,包括:
输入装置,用于接收用户所输入的特征;
识别装置,用于将所述输入装置接收的特征中的每一个的维度识别为主维度、次维度和附加维度中之一;
构造装置,用于根据识别的所述维度将所述输入装置接收的特征构造为具有复合索引的特征检索结构;以及
检索装置,用于在根据权利要求5-7中任何一项所述的设备中的索引储存库中进行检索,以检索出具有所述构造装置构造的特征检索结构的文档。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010192559.0/1.html,转载请声明来源钻瓜专利网。