[发明专利]结构化文档检索显示方法和装置无效
申请号: | 98115571.5 | 申请日: | 1998-07-01 |
公开(公告)号: | CN1206883A | 公开(公告)日: | 1999-02-03 |
发明(设计)人: | 冈本卓哉;高桥亨;青山由纪;山崎纪之;村田英子 | 申请(专利权)人: | 株式会社日立制作所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 | 代理人: | 于静 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 结构 文档 检索 显示 方法 装置 | ||
本发明涉及根据SGML、HTML等而生成的结构化文档的检索显示技术,特别是对结构化文档进行检索并对检索结果以高亮度进行显示的结构化文档检索显示方法和装置。
随着文字处理器等的普及,所生成的文档信息的电子化获得了很大发展。这些电子化文档根据生成的机器、软件不同而具有各自的格式,别的机器或软件不能利用,或者需要准备某种变换手段。
作为这种文档交换用的共同格式,已提出了各种结构化文档。这些结构化文档,不仅可以定义作为文档的基本结构的章、节、项等层次结构,而且可以包含格式信息。
作为结构化文档的记述语言,现在已标准化了,这就是SGML(Standard Generalized Markup Language)=「标准通用置标语言」。
SGML使用通过把称为标记的特定结构化文档的结构信息的字符串插入到文本中来表现文档的结构的方法。在SGML中,可以根据DTD(Document Type Definition)=「文档类型定义」规定标记的名称、内容以及由标记所示的文档结构。
对于上述SGML、DTD,在「实践SGML」(SGML恳谈会实用化WG监译1992年4月20日财团法人日本规格协会发行)中已详细说明。
设想了将这些结构化文档登录到检索系统的DB中,指定结构名进行检索的情况。想登录的各文档的DTD不同时,作为处理方法,提出了对各文档分析文档结构,在分析了所指定的结构名与哪一部分相当的基础上,取得检索对象的字符串进行检索的方法。
但是,该方法需要很长的处理时间。另外,使用对各结构名用表就各文档的对应的地方的等方法时,必须全部统一管理在各文档中出现的结构名,必须对各结构名登录各文档的对应的部分,从而需要庞大的管理表。
此外,即使登录了不同的DTD混合存在的文档,也不限于所有的文档具有检索对象的结构,另外,例如像「摘要」、「大意」那样,即使是相同的内容也起了不同的结构名时,则必须全部指定这些不同的结构名进行检索,所以,不能认为是现实的结构化文档的检索。
因此,在结构化文档的检索中,必须运用的是只登录按相同的文档类型定义生成的文档。对于预先指定的结构名,管理各文档的对应的部分。
在进行检索时,如果指定了检索对象的结构名和检索条件,在与各文档的指定的结构对应的部分包含符合检索条件的字符串时,就判定与检索条件匹配。
作为结构化文档的检索结果,下面介绍用于显示文档的内容的功能的的先有技术。
首先,作为第1先有技术,有特开平8-339369「文档显示装置和文档显示方法」。
本先有技术,介绍了SGML文档的结构分析和向结构显示用的格式的变换以及进行指定结构的内容的显示的方法,通过使用本技术可以按结构单位显示结构化文档。此外,在本先有技术中,提供了指定结构的高亮度显示(就是强调的显示,改变颜色、字体、字的大小等,附加下划线)的手段。
但是,这里所说的所谓的高亮度显示手段,就是对各结构控制显示方法的手段,按结构单位进行有无显示、高亮度显示等的指定。因此,在本先有技术中,当然没有给出实现结构化文档的检索结果的显示时所需要的实现对已匹配的检索项的高亮度显示的方法。
另外,作为第2先有技术,有在特开平8-212230「文档检索方法和文档检索装置」中给出的对结构化文档以外的文档的检索结果的高亮度显示方法。
但是,本先有技术只实现了对用于进行显示的文本的匹配范围的取得和高亮度信息的附加,对于作为结构化文档的检索结果而得到的文档则不具有附加高亮度信息的功能。
只将上述2个先有技术组合,对于作为对结构化文档的检索结果而输出的文档不能实现对已匹配的项的高亮度信息的附加。
即,在结构化文档中,为了实现高亮度显示,需要在显示对象的文档生成时的DTD中生成追加高亮度用的结构信息的DTD的手段。
关于对结构化文档附加高亮度信息时的文档类型定义的变更方法,就是第3先有技术。在特愿平8-159202「结构化文档的版管理方法和装置」中给出了对原来的DTD生成追加新的结构的DTD的方法。
通过使用本先有技术,可以生成附加高亮度信息的文档类型定义。
利用第1、第2先有技术可知,进行显示可以知道结构化文档的结构,此外在未结构化的文档中,可以进行匹配范围的高亮度显示。
另外,通过使用第3先有技术,可以指定附加了对各结构取得的高亮度信息的文档类型定义。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社日立制作所,未经株式会社日立制作所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/98115571.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于局部治疗和美容制剂的组合物基料
- 下一篇:用于印制照片的数字图象处理系统