[发明专利]关联词登记装置、信息处理装置、关联词登记方法、关联词登记装置用程序以及记录介质有效
申请号: | 201180053722.8 | 申请日: | 2011-11-07 |
公开(公告)号: | CN103201737A | 公开(公告)日: | 2013-07-10 |
发明(设计)人: | 平手勇宇 | 申请(专利权)人: | 乐天株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 李辉;黄纶伟 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 关联词 登记 装置 信息处理 方法 程序 以及 记录 介质 | ||
技术领域
本发明涉及登记检索关键字作为关联词的关联词登记装置、信息处理装置、关联词登记方法、关联词登记装置用程序以及记录介质的技术领域。
背景技术
为了补充检索关键字并提高翻译等的精度,在信息检索系统、自然语言处理系统、机械翻译系统等中利用同义词辞典这种单词数据库。研究了用于自动构建该同义词辞典的各种装置。例如,在专利文献1中公开了如下的意思辞典登记装置:利用意思辞典中的已经赋予了意思信息的辞典条目的信息,自动对输入辞典条目赋予意思信息。
现有技术文献
专利文献
专利文献1:日本特开2000-268035号公报
发明内容
发明要解决的课题
但是,在专利文献1所记载的技术中,根据输入数据和已登记的全部数据的单纯的单词间意思的距离来判定近义,所以,近义的判定精度低,无法抑制不需要的同义词这样的关联词的登记。因此,难以构建高精度的同义词辞典等的关联词的辞典。
本发明是鉴于这种问题而完成的,其课题的一例的目的在于,提供能够登记高精度的关联词的关联词登记装置等。
用于解决课题的手段
为了解决上述课题,第1方面所记载的发明是一种关联词登记装置,其具有:关联词候选集合生成单元,其根据规定条件从存储了与检索查询有关的记录的检索查询记录中提取关联词的候选,生成关联词候选集合;接收单元,其接收用户输入的检索字的检索查询;部分字符串生成单元,其根据所述检索字的字符串生成部分字符串;候选字符串提取单元,其根据所述生成的部分字符串,从所述关联词候选集合中提取候选字符串;得分计算单元,其根据所述候选字符串与所述检索字之间的相似度、所述候选字符串的使用次数和基于所述候选字符串的检索的检索结果数,计算所述候选字符串的适宜性得分;排序单元,其按照所述得分的顺序对所述候选字符串进行排序;判定基准生成单元,其根据所述候选字符串的适宜性得分和排序,生成针对所述排序的适宜性得分的基准线,作为是否将所述候选字符串登记为关联词的判定基准;登记字符串提取单元,其提取所述适宜性得分与基准线之间的背离为预先设定的阈值以上的候选字符串,作为用于登记为关联词的登记字符串;以及关联词登记单元,其在关联词数据库中登记所述提取出的登记字符串和所述检索字作为关联词。
第2方面所记载的发明的特征在于,在第1方面所记载的关联词登记装置中,所述部分字符串生成单元根据所述检索字的字符数设定部分字符串的长度,生成该设定的长度的部分字符串。
第3方面所记载的发明的特征在于,在第1方面所记载的关联词登记装置中,所述部分字符串生成单元根据所述检索字的字符数设定生成部分字符串时的检索字的字符数的移动宽度,以该设定的移动宽度生成部分字符串。
第4方面所记载的发明的特征在于,在第1~3方面中的任意一个方面所记载的关联词登记装置中,所述部分字符串生成单元针对使所述检索字进行表音变换后的检索字生成所述部分字符串。
第5方面所记载的发明的特征在于,在第1~4方面中的任意一个方面所记载的关联词登记装置中,所述关联词登记装置还具有参数调节单元,该参数调节单元对所述得分计算单元的所述相似度和所述使用次数的信息进行调节。
第6方面所记载的发明的特征在于,在第1~5方面中的任意一个方面所记载的关联词登记装置中,所述判定基准生成单元由对所述排序与所述适宜性得分之间的关联进行近似的近似函数或规定范围的所述排序的数据求出所述基准线。
第7方面所记载的发明的特征在于,在第1~6方面中的任意一个方面所记载的关联词登记装置中,所述登记字符串提取单元对要提取的所述登记字符串的数量设置上限。
第8方面所记载的发明的特征在于,在第1~7方面中的任意一个方面所记载的关联词登记装置中,所述关联词登记装置还具有检索字存储单元,该检索字存储单元存储与内部或外部的EC网站中销售的商品关联的检索字。
第9方面所记载的发明的特征在于,在第1~8方面中的任意一个方面所记载的关联词登记装置中,所述得分计算单元根据与所述检索查询有关的记录的数据计算所述适宜性得分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于乐天株式会社,未经乐天株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201180053722.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:体育场地活动太阳能更衣室
- 下一篇:一种重组竹框架结构的梁柱刚性节点连接