[发明专利]近义词列表的生成方法及生成装置、使用该近义词列表的检索方法及检索装置有效
申请号: | 201210080115.7 | 申请日: | 2012-03-23 |
公开(公告)号: | CN102722477A | 公开(公告)日: | 2012-10-10 |
发明(设计)人: | 山口伦治 | 申请(专利权)人: | 卡西欧计算机株式会社 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 张敬强;李家浩 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 近义词 列表 生成 方法 装置 使用 检索 | ||
1.一种近义词列表的生成方法,其特征在于,具备:
判定基准词和与其对应的近义词是否包含在包含成为检索对象的多个文档数据的文档数据组中的判定步骤;
对判定为包含在上述文档数据组中的基准词和近义词进行提取的提取步骤;
基于上述文档数据组中的该近义词和对应的基准词的至少一方的出现状况,设定上述提取出的近义词的输出优先级的设定步骤;以及
针对上述提取出的基准词,以设定了上述输出优先级的近义词与该基准词对应的方式来生成近义词列表的生成步骤。
2.根据权利要求1所述的近义词列表的生成方法,其特征在于,
在上述设定步骤中,识别同时包含该近义词和对应的基准词的文档数据的个数,基于该识别出的个数,对上述提取出的近义词设定输出优先级。
3.根据权利要求1所述的近义词列表的生成方法,其特征在于,
在上述设定步骤中,识别同时包含该近义词和对应的基准词的文档数据的个数,该识别出的个数越少,对上述提取出的近义词设定越高的输出优先级。
4.一种检索方法,其特征在于,
该检索方法是一种使用由如下近义词列表的生成方法生成的近义词列表的检索方法,其中,该近义词列表的生成方法具备如下步骤:判定基准词和与其对应的近义词是否包含在包含成为检索对象的多个文档数据的文档数据组中的判定步骤;对判定为包含在上述文档数据组中的基准词和近义词进行提取的提取步骤;基于上述文档数据组中的该近义词和对应的基准词的至少一方的出现状况,设定上述提取出的近义词的输出优先级的设定步骤;以及,针对上述提取出的基准词,以设定了上述输出优先级的近义词与该基准词对应的方式来生成近义词列表的生成步骤,
该检索方法具备:
从上述文档数据组中,确定出包含有所希望的检索字符串的文档数据的文档确定步骤;
输出上述确定出的文档数据的文档输出步骤;
判定上述近义词列表所具有的基准词是否包含在上述检索字符串中的基准词判定步骤;以及
将与判定为包含在上述检索字符串中的基准词对应的近义词,以与对该近义词设定的输出优先级对应的方式进行输出的近义词输出步骤。
5.根据权利要求4所述的检索方法,其特征在于,
在上述基准词判定步骤中,判定上述近义词列表所具有的基准词是否包含于上述检索字符串中的用户指定的字符串,
在上述近义词输出步骤中,将与判断为包含在上述用户指定的字符串中的基准词对应的近义词,以与对该近义词设定的输出优先级对应的方式来进行输出。
6.一种近义词列表的生成装置,其特征在于,具备:
判定单元,其对基准词和与其对应的近义词是否包含在包含成为检索对象的多个文档数据的文档数据组中进行判定;
提取单元,其对判定为包含在上述文档数据组中的基准词和近义词进行提取;
设定单元,其基于上述文档数据组中的该近义词和对应的基准词的至少一方的出现状况,设定上述提取出的近义词的输出优先级;以及
生成单元,其针对上述提取出的基准词,以设定了上述输出优先级的近义词与该基准词对应的方式来生成近义词列表。
7.根据权利要求6所述的近义词列表的生成装置,其特征在于,
在上述设定单元中,识别同时包含该近义词和对应的基准词的文档数据的个数,基于该识别出的个数设定上述提取出的近义词的输出优先级。
8.根据权利要求6所述的近义词列表的生成装置,其特征在于,
在上述设定单元中,识别同时包含该近义词和对应的基准词的文档数据的个数,该识别出的个数越少,对上述提取出的近义词设定越高的输出优先级。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于卡西欧计算机株式会社,未经卡西欧计算机株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210080115.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:通过电穿孔技术进行的外源基因转移方法
- 下一篇:高炉法兰焊接装置和方法