[发明专利]根据输入关键词产生衍生关键词的资料检索系统及其方法无效
申请号: | 201010244106.8 | 申请日: | 2010-07-28 |
公开(公告)号: | CN102346741A | 公开(公告)日: | 2012-02-08 |
发明(设计)人: | 邱全成;徐胡晨 | 申请(专利权)人: | 英业达股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市浩天知识产权代理事务所 11276 | 代理人: | 刘云贵 |
地址: | 中国台*** | 国省代码: | 中国台湾;71 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 根据 输入 关键词 产生 衍生 资料 检索系统 及其 方法 | ||
技术领域
本发明涉及一种资料系统及其方法,特别系指一种根据输入的关键词产生衍生关键词的资料检索系统及其方法。
背景技术
资料检索是一种接收关键词后,根据关键词至资料库中检索包含关键词的资料项的技术,普遍应用于网页搜寻引擎、电子或线上词典以及各种大型资料库的资料搜寻上。以往的资料检索,其是通过先接收使用者输入的关键词,接着比对资料项中是否具有关键词,若有则将包含关键词的资料项撷取出来,借此,使用者可以快速的从大量的资料项中过滤出部分资料项。
然而,在以往进行资料检索的过程中,虽可检索出包含关键词的资料项,但并无法根据关键词衍生搜寻出其他的可能关联资料项。举例来说,假设使用者欲搜寻具有花与花瓶的资料项时,输入关键词“花”及“花瓶”即可检索出具有其中一个关键词或是两个关键词皆包含的资料项。但是,当使用者希望借由“花”及“花瓶”的衍生关联性搜寻出与“花盆”相关的资料项时,必须自行输入“花盆”这个关键词,才能搜寻出包含“花盆”的资料项,而无法根据“花”及“花瓶”的关联性衍生“花盆”这个关键词进行检索。
虽然目前可以在使用者输入关键词时提示以往经常被拿来搜寻的关键词组,但这些作为提示的关键词组通常是必须被经常搜寻才能够成为提示的关键词组,当关键词之间具有关联性但却非经常被用来搜寻时,便无法检索到与已输入关键词有关联性但不包含已输入关键词的资料项,产生了无法全面性的将与已输入关键词相关的资料项完整地撷取出来的问题。举前述的例子而言,即输入“花”及“花瓶”,虽能撷取出包含“花”及“花瓶”作为关键词的资料项,但却无法撷取出仅包含“花盆”这个关键词的资料项。
综上所述,可知现有技术中长期以来一直存在资料检索结果的资料完整性不佳的问题,因此有必要提出改进的技术手段,来解决此一问题。
发明内容
有鉴于现有技术存在的问题,本发明遂公开一种根据关键词衍生关联性词汇的词库检索系统及其方法,其中:
本发明所公开的根据关键词衍生关联性词汇的词库检索系统,其包含:资料库,预先储存有至少一笔资料项;词库,预先储存有至少关键词,其中各关键词更对应有至少一索引;接收模块,用以接收输入的查询字串;比对撷取模块,用以于接收模块接收到查询字串后根据查询字串至词库中比对出至少一第一关键词,并至词库撷取各第一关键词对应的至少一索引并进行比对,其中:当至少一第一关键词存在有至少一个相同的索引时,至词库撷取出具有相同索引的至少一第二关键词,并以所有第一关键词及所有第二关键词撷取资料库的资料项;及当至少一第一关键词不存在有相同索引时,根据文字关联性演算法取得至少一第三关键词,并以所有第一关键词及所有第三关键词撷取资料库的资料项;及显示模块,用以显示撷取的资料项。
所述的根据关键词衍生关联性词汇的词库检索系统,其中所述的至少一索引系为各关键词的词性及词义分类。此外文字关联性演算法系为最长共同连续字串演算法或文字合并演算法,当为最长共同连续字串演算法时,所述的比对撷取模块更包含以演算出的最长共同连续字串结合至少一万用字元至词库撷取出至少一第三关键词,当为文字合并演算法时,所述的比对撷取模块更包含以演算出的至少一结合字作为第三关键词。
本发明所公开的根据输入关键词产生衍生关键词的资料检索方法,其包含步骤:预先建立储存有至少一笔资料项的资料库;预先建立储存有至少一关键词的词库,其中各关键词更对应有至少一索引;接收输入的查询字串并根据查询字串至词库比对出至少一第一关键词;至词库撷取各第一关键词对应的至少一索引进行比对,其中:当至少一第一关键词存在有至少一个相同的索引时,至词库撷取出具有相同索引的至少一第二关键词,并以所有第一关键词及所有第二关键词撷取该资料库的资料项;及当至少一第一关键词不存在有相同索引时,根据文字关联性演算法取得至少一第三关键词,并以所有第一关键词及所有第三关键词撷取资料库的资料项;及显示撷取的资料项。
所述的根据输入关键词产生衍生关键词的资料检索方法,其中所述的至少一索引系为各关键词的词性及词义分类。此外文字关联性演算法系为最长共同连续字串演算法或文字合并演算法,当为最长共同连续字串演算法时,所述的方法更包含以演算出的最长共同连续字串结合至少一万用字元至词库撷取出至少一第三关键词,当为文字合并演算法时,所述的方法更包含以演算出的至少一结合字作为第三关键词。
本发明所公开的系统与方法如上,与现有技术之间的差异在于本发明具有根据输入的查询字串至词库比对出至少一关键词,并根据至少一关键词产生衍生关键词,并以已输入关键词及衍生关键词同步检索资料项的技术手段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英业达股份有限公司,未经英业达股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010244106.8/2.html,转载请声明来源钻瓜专利网。