[发明专利]一种关联数据的索引、检索、存储和显示控制的信息系统无效
申请号: | 200710192532.X | 申请日: | 2007-12-07 |
公开(公告)号: | CN101178733A | 公开(公告)日: | 2008-05-14 |
发明(设计)人: | 彭海杰 | 申请(专利权)人: | 彭海杰 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 长沙永星专利商标事务所 | 代理人: | 周咏;米中业 |
地址: | 410073湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 关联 数据 索引 检索 存储 显示 控制 信息系统 | ||
技术领域
本发明涉及信息技术领域,特别涉及一种具有关联关系数据的存储、索引、检索和呈现控制的信息系统。
背景技术
在当前信息社会里,随着信息技术的逐渐普及,信息系统得到了广泛应用。随着信息系统中积累的数据越来越多,人们已经逐渐依赖于通过检索来快速的从信息系统中获得信息。人们在信息系统中检索信息时,常常会得到很多的结果,其中夹杂的大量不相关内容降低了人们获取信息的效率,同时也降低了系统资源的有效利用率。这种现象在海量信息系统的检索中显得尤为突出,例如在现有的搜索引擎中检索某个信息时,常常会得到大量信息,因此,人们不得不对搜索引擎返回的大量结果逐个进行分辨,以确定是否是所需要的内容,这导致了低下的信息获取效率。而检索结果不准确、检索质量不高则是目前海量信息系统中普遍存在的问题。
目前,基于关键词匹配技术的文本检索系统在建立索引时,通常先将文本中出现的关键词与关键词所在文本的定位信息生成索引数据库,然后用信息系统提供的检索界面输入检索词进行检索,系统在索引数据库中对用户所提供的检索词进行匹配查找,得到检索词所在文本的定位信息,最后显示由该定位信息所确定的文本的摘要或全文。在关键词匹配技术的基础上还可实现布尔检索。
为给文本中存在的信息做索引,索引系统需对文本作语义分析,而文本的歧义处理是文本语义分析中无法绕过的过程。歧义是指同一种语言形式可以表示多种意义的现象,歧义可以在词汇、句法、语义、语用等多个层面发生。形成歧义的主要原因是以一维线性的文本方式组织的语言结构是有限的,而语义则是无穷的,用有限的结构表达近乎无穷的意思会不可避免的造成一个语言结构表达多种语义内容的一对多现象,这是产生歧义的根源,也是文本语义分析技术的最大障碍。例如,一个词对应于多个含义的一词多义现象、不同的词序导致的词序歧义等一对多现象。基于一维线性文本的信息组织方式是导致数据处理系统难以解决其歧义问题的根本原因,因此,在目前信息系统中信息量急剧增多的背景下,寻找一种能够易于减小语义歧义的信息组织方法就变得非常迫切。
从检索词与文档这两者之间的关系角度上来说,基于关键词匹配技术的检索本质上是一种对检索词在文档中的出现关系的检索。由此可以发现,基于关键词匹配技术的检索在如下两个环节上存在不足:第一个环节是在建立索引时,除了关键词在文本中是否出现的信息,索引数据中没有保存文档中存在的其它信息。例如,存在于文本中的因果关系、时间先后秩序、空间关系等。这实际上是在索引过程中就已经丢失了文本里包含的信息,造成了信息缺失,从而使得索引数据不足以完整的反映文本中的信息。第二个环节是在检索时,由检索词所构成的布尔检索条件描述的仅是检索词在文本中的出现条件,因此检索条件缺乏描述文本中复杂语义的能力,这使得用户无法明确、详细的描述检索目标。上述两个环节中存在的不足直接造成了基于简单关键词匹配技术的检索查不准、检索质量不高的结果。
目前以web服务器一浏览器为主流模式的互联网应用存在的一个明显的缺点是,在绝大多数情况下人们只能通过浏览器被动地接收信息,而难以灵活的对所浏览的信息进行加工处理(如标记、增添、修改等)并对加工处理后所增添的信息进行灵活共享,这种信息的单向传播方式主要是由超文本的信息组织方式、存取方式以及显示方式所决定的。虽然有维客(wiki)这样的应用能够在线的使人们对浏览器中的信息做一些简单的加工和处理,并对所加工后的信息进行共享,但这仍然离交互的、便捷的对信息进行再加工并灵活共享加工后所得信息的目标相差甚远。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于彭海杰,未经彭海杰许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710192532.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种海陆兼容的卫星雷达高度计跟踪器
- 下一篇:应用于存储器的多稳态感测放大器
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置