[发明专利]倒排索引建立方法无效
申请号: | 200910260705.6 | 申请日: | 2009-12-29 |
公开(公告)号: | CN102110123A | 公开(公告)日: | 2011-06-29 |
发明(设计)人: | 黄九鸣;周斌;贾焰;邹鹏;吴泉源;杨树强;韩伟红;李爱平;梁政;单大甫;蒋子海;崔凯;韩毅 | 申请(专利权)人: | 中国人民解放军国防科学技术大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇 |
地址: | 410073 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种倒排索引建立方法,所述倒排索引包括抽取结果表,所述抽取结果表包括文档号以及与该文档号相对应的抽取结果记录,所述抽取结果记录包括有类型、内容以及位置信息项;该方法包括:对由字符串格式表示的文档做分词操作,从所述分词操作结果中取出一个词;判断所取出的词是否属于某一类型的数据,如果属于,则执行下一步,否则,为所取出的词建立通用的倒排索引表后结束操作;将所提取出来的词的内容、在所在文档中的位置以及判断该词是否属于某一类型的数据时所采用的检测方法分别填入所述抽取结果记录中的内容、位置以及类型信息项,创建抽取结果表,然后为所取出的词建立通用的倒排索引表。 | ||
搜索关键词: | 索引 建立 方法 | ||
【主权项】:
一种倒排索引建立方法,所述倒排索引包括抽取结果表,所述抽取结果表包括文档号以及与该文档号相对应的抽取结果记录,所述抽取结果记录包括有类型、内容以及位置信息项;该方法包括:步骤1)、对由字符串格式表示的文档做分词操作,从所述分词操作结果中取出一个词;步骤2)、判断所取出的词是否属于某一类型的数据,如果属于,则执行下一步,否则,执行步骤4);步骤3)、将所提取出来的词的内容、在所在文档中的位置以及判断该词是否属于某一类型的数据时所采用的检测方法分别填入所述抽取结果记录中的内容、位置以及类型信息项,创建抽取结果表,然后执行下一步;步骤4)、为所取出的词建立通用的倒排索引表。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科学技术大学,未经中国人民解放军国防科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200910260705.6/,转载请声明来源钻瓜专利网。
- 上一篇:电熔大碹砖整体组立装置
- 下一篇:一种污泥混合设备