[发明专利]文档检索系统及文档检索方法有效
申请号: | 200810005866.6 | 申请日: | 2008-02-15 |
公开(公告)号: | CN101295307A | 公开(公告)日: | 2008-10-29 |
发明(设计)人: | 大井洋子;丹羽芳树;小原清弘 | 申请(专利权)人: | 株式会社日立制作所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 | 代理人: | 曲瑞 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种文档检索系统及文档检索方法,考虑文档中的数值数据的相似度来进行检索。对属性A的数值集合D,生成包含D的全部要素的数值区间集合E,通过使在区间内包含D的要素x的区间对应1、使不包含的区间对应0,来对文档中的数值附加索引。文本部分使用单词频度、数值部分使用所述数值的索引附加方法,来对包含数值的文档数据附加索引。使用如此生成的文档数据的索引,计算基于矢量空间法或概率模型的文档数据间的相似度,从相似度高的文档数据开始依次提示。 | ||
搜索关键词: | 文档 检索系统 检索 方法 | ||
【主权项】:
1、一种文档检索系统,其特征在于,具有:文档数据库,存储了多个文档的数据;每个文档的索引,将存储于所述文档数据库中的文档中的数值作为表示该数值的属性的标志、包含该数值的数值区间、和在文档中的出现频度的组来附加索引,并将文档中的文本作为构成该文本的单词和其出现频度的组来附加索引;和运算部,接收文档的指定作为检索输入,使用所述索引,计算所述指定的文档与存储于所述文档数据库中的文档间的相似度,从相似度高的文档开始,依次提示。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社日立制作所,未经株式会社日立制作所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200810005866.6/,转载请声明来源钻瓜专利网。