[发明专利]检索支援装置及检索支援方法有效
申请号: | 201210082643.6 | 申请日: | 2012-03-26 |
公开(公告)号: | CN103324646B | 公开(公告)日: | 2017-03-01 |
发明(设计)人: | 新名博;服部雅一 | 申请(专利权)人: | 株式会社东芝;东芝解决方案株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 永新专利商标代理有限公司72002 | 代理人: | 陈萍 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检索 支援 装置 方法 | ||
技术领域
本发明涉及检索支援装置及检索支援方法。
背景技术
文书检索是从作为检索对象的文书集合中检索包含用户指定的检索关键字的文书的技术。在此,所谓“文书”,不仅包括电子化的文书,还包括具有文本数据的各种内容。为了减轻文书检索中的用户的操作负担,以前提出了各种检索支援方法。
例如,已知根据过去的检索式的履历,将检索关键字的候补提示给用户的方法。在该方法中,若通过用户的输入操作而输入例如“扩散强调像”这样的检索关键字,则作为接在其后的检索关键字的候补,提议“延迟相位”、“脂肪”、“高信号”、“轴位”等过去的检索式的履历之中频繁地搭配的单词。根据该方法,可以使包括多个检索关键字的检索式的生成变得容易,并减轻用户的操作负担。但是,在该方法中,为了提议适当的检索关键字的候补,需要较多履历,在履历较偏、不足的情况下,存在提议的质量降低,不能对目的文书进行检索的担忧。
而且,已知使用定义了存在搭配关系的2个单词的组合的搭配字典,将检索关键字的候补提议给用户的方法。在该方法中,若通过用户的输入操作而输入某一单词作为检索关键字,则作为接在其后的检索关键字的候补,提议作为相对于输入的检索关键字的、搭配概率高的单词而登记在搭配字典中的单词。根据该方法,可以使包括多个检索关键字的检索式的生成变得容易,并减轻用户的操作负担。但是,在该方法中,需要准备事先定义了单词彼此的搭配关系的搭配字典,而且,在事先准备的搭配字典不适用于作为检索对象的文书集合的情况下,存在提议的质量降低,不能对目的文书进行检索的担忧。
如以上所述,在使包括多个检索关键字的检索式的生成变得容易的现有技术中,存在提议的质量降低而不能对目的文书进行检索的情况,要求改良。
现有技术文献
专利文献1:日本特许第2850952号公報
专利文献2:日本特开2006-48286号公報
发明内容
本发明要解決的问题是提供检索支援装置及检索支援方法,不对用户要求事前的繁杂的操作,就可以提议适合于检索对象的文书集合的、检索关键字的候补,并适当地支援文书的检索。
实施方式的检索支援装置具备抽取部、计算部、第1检测部、第1生成部、第2生成部、第1识别部、搭配传播部、第2识别部、提示部和检索部。抽取部从检索对象的文书集合中抽取关键字候补。计算部对于被抽取的2个关键字候补的组合,计算一个关键字候补与另一个关键字候补一起出现在上述文书集合内的同一文书中的概率、即搭配概率。第1检测部检测上述搭配概率满足第1条件的2个关键字候补的组合、即搭配关键字组。第1生成部生成搭配字典,该搭配字典是以上述搭配关键字组的一方的关键字候补为词条,且将另一方的关键字候补作为搭配词语的字典要素的集合。第2生成部生成字符串补充规则,该字符串补充规则是用于对输入字符串进行补充而得到的上述搭配关键字组中所含的关键字候补的规则。第1识别部将通过按照上述字符串补充规则对输入字符串进行补充而得到的关键字候补,识别为输入关键字。搭配传播部反复进行参照上述搭配字典、取得将上述输入关键字作为词条的字典要素的搭配词语,取得将取得的搭配词语作为词条的字典要素的搭配词语的处理。第2识别部将在将上述输入关键字和通过上述搭配传播部的处理而取得的搭配词语关联起来的字串之中的、满足第2条件的字串,识别为提议字串。提示部提示上述提议字串。检索部在选择了提示的上述提议字串的情况下,根据该提议字串来生成检索式而进行针对上述文书集合的检索。
附图文字
图1是示出第1实施方式的检索支援装置的功能的构成的框图。
图2是示出检索对象的文书集合的一个例子的图。
图3是示出从检索对象的文书集合中抽取的关键字候补的一个例子的图。
图4是示出抽取的关键字候补和出现频率之间的关系的一个例子的图。
图5是示出2个关键字候补的组合的出现频率的一个例子的图。
图6是示出2个关键字候补间的搭配概率的一个例子的图。
图7是示出搭配网络的一个例子的图。
图8是示出搭配关键字组检测部的处理的一个例子的流程图。
图9是示出构成搭配字典的字典要素的数据结构的一个例子的图。
图10是示出搭配字典的一个例子的图。
图11是示出PAT树的一个例子的图。
图12是示出字串的数据结构的一个例子的图。
图13是示出输入关键字识别部、搭配传播部及提议字串识别部的处理的一个例子的流程图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝;东芝解决方案株式会社,未经株式会社东芝;东芝解决方案株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210082643.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种袜子展示架
- 下一篇:用于凳子或椅子的调节支架