[发明专利]单词语义关系估计装置和单词语义关系估计方法有效
申请号: | 201780096022.4 | 申请日: | 2017-10-26 |
公开(公告)号: | CN111226223B | 公开(公告)日: | 2023-10-20 |
发明(设计)人: | 内出隼人 | 申请(专利权)人: | 三菱电机株式会社 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/247;G06F16/33 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 马建军;邓毅 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 单词 语义 关系 估计 装置 方法 | ||
1.一种单词语义关系估计装置,其中,该单词语义关系估计装置具有:
单词检索部,其从数据库检索构成所输入的单词对的各单词;
单词向量提取部,其从所述数据库提取与所述单词检索部检索到的所述各单词对应的单词向量;
字符向量转换部,其将构成所述单词对的字符转换成字符向量;
特征量取得部,其将所述单词向量提取部提取出的所述各单词的单词向量和所述字符向量转换部转换后的所述字符向量结合,取得特征量;以及
估计部,其根据所述特征量取得部取得的所述特征量估计所述各单词间的语义关系。
2.根据权利要求1所述的单词语义关系估计装置,其特征在于,
所述单词语义关系估计装置具有估计器切换部,该估计器切换部根据所述单词检索部是否从所述数据库检索到所述各单词,切换以所述单词向量和所述字符向量为特征量来估计所述各单词间的语义关系的第1估计器和仅以所述字符向量为特征量来估计所述各单词间的语义关系的第2估计器,
在所述单词检索部从所述数据库检索到所述各单词的情况下,所述特征量取得部取得将所述单词向量和所述字符向量结合而成的特征量,在未能从所述数据库检索到各单词的情况下,所述特征量取得部取得所述字符向量作为特征量,
所述估计部根据所述估计器切换部的切换,应用所述第1估计器或所述第2估计器,根据所述特征量取得部取得的特征量估计所述各单词间的语义关系。
3.根据权利要求1所述的单词语义关系估计装置,其特征在于,
所述单词语义关系估计装置具有追加检索部,在所述单词检索部未能从所述数据库检索到所述各单词的情况下,该追加检索部从所述数据库检索与构成所述单词对中包含的未知词的字符部分地一致的单词,
所述单词向量提取部从所述数据库,检索对应于所述追加检索部检索到的与构成所述未知词的字符部分地一致的单词的单词向量。
4.根据权利要求2所述的单词语义关系估计装置,其特征在于,
所述单词语义关系估计装置具有追加检索部,在所述单词检索部未能从所述数据库检索到所述各单词的情况下,该追加检索部从所述数据库检索与构成所述单词对中包含的未知词的字符部分地一致的单词,
所述估计器切换部根据所述追加检索部是否从所述数据库检索到与构成所述未知词的字符部分地一致的单词,切换所述第1估计器和所述第2估计器,
在所述追加检索部从所述数据库检索到与构成所述未知词的字符部分地一致的单词的情况下,所述特征量取得部取得将所述单词向量和所述字符向量结合而成的特征量,在未能从所述数据库检索到与构成所述未知词的字符部分地一致的单词的情况下,所述特征量取得部取得所述字符向量作为特征量。
5.根据权利要求1所述的单词语义关系估计装置,其特征在于,
所述估计部基于估计所述各单词间的语义关系的估计器的教师数据的构造信息,估计提取程度,所述提取程度表示估计出所述语义关系的所述各单词间的上位下位关系的距离。
6.一种单词语义关系估计方法,其中,该单词语义关系估计方法具有如下步骤:
单词检索部从数据库检索构成所输入的单词对的各单词;
单词向量提取部从所述数据库提取与所述检索到的所述各单词对应的单词向量;
字符向量转换部将构成所述单词对的字符转换成字符向量;
特征量取得部将所述提取出的所述各单词的单词向量和所述转换后的所述字符向量结合,取得特征量;以及
估计部根据所述取得的所述特征量估计所述各单词间的语义关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三菱电机株式会社,未经三菱电机株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780096022.4/1.html,转载请声明来源钻瓜专利网。