[发明专利]关联词登记装置、信息处理装置以及关联词登记方法有效
申请号: | 201310231780.6 | 申请日: | 2011-11-07 |
公开(公告)号: | CN103279557A | 公开(公告)日: | 2013-09-04 |
发明(设计)人: | 平手勇宇 | 申请(专利权)人: | 乐天株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 李辉;黄纶伟 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 关联词 登记 装置 信息处理 以及 方法 | ||
本申请是申请日为2011年11月7日,申请号为201180053722.8,发明名称为“关联词登记装置、信息处理装置、关联词登记方法、关联词登记装置用程序以及记录介质”的发明专利申请的分案申请。
技术领域
本发明涉及登记检索关键字作为关联词的关联词登记装置、信息处理装置以及关联词登记方法的技术领域。
背景技术
为了补充检索关键字并提高翻译等的精度,在信息检索系统、自然语言处理系统、机械翻译系统等中利用同义词辞典这种单词数据库。研究了用于自动构建该同义词辞典的各种装置。例如,在专利文献1中公开了如下的意思辞典登记装置:利用意思辞典中的已经赋予了意思信息的辞典条目的信息,自动对输入辞典条目赋予意思信息。
专利文献1:日本特开2000-268035号公报
但是,在专利文献1所记载的技术中,根据输入数据和已登记的全部数据的单纯的单词间意思的距离来判定近义,所以,近义的判定精度低,无法抑制不需要的同义词这样的关联词的登记。因此,难以构建高精度的同义词辞典等的关联词的辞典。
发明内容
本发明是鉴于这种问题而完成的,其课题的一例的目的在于,提供能够登记高精度的关联词的关联词登记装置等。
为了解决上述课题,第1方面所记载的发明是一种关联词登记装置,其具有:接收单元,其接收用户输入的检索字的检索查询;检索查询存储单元,其按照接收顺序存储所述接收到的检索查询;检索查询提取单元,其根据预先设定的检索查询提取条件,从所述检索查询存储单元中提取接收顺序比所述接收到的检索查询早的先前的检索查询;字符串组存储单元,其存储构成所述提取出的先前的检索查询的先前的检索字和构成所述接收到的检索查询的检索字,作为字符串组;字符串提取单元,其根据预先设定的字符串组提取开始条件,从所述字符串组存储单元中提取所述先前的检索字相同或相似的字符串组;关联词确定单元,其根据预先设定的登记条件,从所述提取出的字符串组确定作为关联词的字符串组;以及关联词登记单元,其在关联词数据库中登记所述确定的字符串组作为关联词。
第2方面所记载的发明的特征在于,在第1方面所记载的关联词登记装置中,所述检索查询存储单元还存储用户识别信息,作为所述检索查询提取条件,所述检索查询提取单元提取输入了所述检索查询的用户的用户识别信息一致的所述先前的检索查询。
第3方面所记载的发明的特征在于,在第1方面或第2方面所记载的关联词登记装置中,作为所述检索查询提取条件,所述检索查询提取单元提取从所述检索查询的接收时刻起规定时间内接收到的先前的检索查询。
第4方面所记载的发明的特征在于,在第1~3方面中的任意一个方面所记载的关联词登记装置中,所述检索查询存储单元还存储类别信息,作为所述检索查询提取条件,所述检索查询提取单元根据所述类别信息提取所述先前的检索查询。
第5方面所记载的发明的特征在于,在第1~4方面中的任意一个方面所记载的关联词登记装置中,作为所述字符串组提取开始条件,在所述检索查询存储单元中的检索查询数或所述字符串组集合的元素数超过规定阈值的情况下,所述字符串提取单元提取所述字符串组。
第6方面所记载的发明的特征在于,在第1~5方面中的任意一个方面所记载的关联词登记装置中,在满足所述字符串组提取开始条件后经过了规定时间的情况下,所述字符串提取单元提取所述字符串组。
第7方面所记载的发明的特征在于,在第1~6方面中的任意一个方面所记载的关联词登记装置中,作为所述登记条件,在所述先前的检索字相同或相似的字符串组中,具有相同或相似的检索字的字符串组的数量或具有相同或相似的检索字的字符串组的比例超过规定阈值的情况下,所述关联词确定单元确定该字符串组作为关联词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于乐天株式会社,未经乐天株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310231780.6/2.html,转载请声明来源钻瓜专利网。