[发明专利]对实体进行语义化的信息处理装置和信息处理方法在审
申请号: | 201611114803.5 | 申请日: | 2016-12-07 |
公开(公告)号: | CN108170689A | 公开(公告)日: | 2018-06-15 |
发明(设计)人: | 宋双永;缪庆亮;孟遥 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 李春晖;高岩 |
地址: | 日本神*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请公开了一种用于对实体进行语义化的信息处理装置和信息处理方法,该信息处理装置包括:关联度计算单元,被配置为计算实体与语义之间的关联度;排序单元,被配置为根据关联度计算单元计算的关联度以及基于实体的上下文的排序权重,对语义进行排序;以及更新单元,被配置为根据用户基于排序对与实体对应的语义的选择,对排序单元在排序中使用的排序权重进行更新。 1 | ||
搜索关键词: | 信息处理装置 语义 排序 关联度计算 排序单元 排序权重 信息处理 关联度 语义化 配置 更新单元 计算实体 更新 申请 | ||
关联度计算单元,被配置为计算实体与语义之间的关联度;
排序单元,被配置为根据所述关联度计算单元计算的所述关联度以及基于所述实体的上下文的排序权重,对所述语义进行排序;以及
更新单元,被配置为根据用户基于所述排序对与所述实体对应的语义的选择,对所述排序单元在排序中使用的所述排序权重进行更新。
2.根据权利要求1所述的信息处理装置,其中,所述关联度计算单元被配置为根据如下中的至少之一来计算所述实体与所述语义之间的关联度:所述实体与所述语义的表义部分的编辑距离、所述实体与所述语义之间的主题向量相似度、所述实体与所述语义之间的词嵌入向量相似度。3.根据权利要求1或2所述的信息处理装置,其中,所述实体为词语,所述排序单元被配置为根据所述关联度计算单元计算的所述关联度,基于所述实体所属的成分以及所述实体的周边实体对所述语义进行排序,所述周边实体为所述实体周边的其他实体中的至少之一。4.根据权利要求3所述的信息处理装置,其中,所述排序单元包括:权重分配子单元,被配置为基于所述实体所属的成分和/或所述周边实体,为所述关联度超过预定阈值的每个候选语义分配权重;
排序子单元,被配置为根据所述权重分配子单元分配的权重,对所述候选语义进行排序。
5.根据权利要求4所述的信息处理装置,其中,所述权重分配子单元被配置为基于所述实体所属的成分为所述候选语义分配权重,以使得:在所述实体为谓语的情况下,增加所述候选语义中的语义本体的权重,在所述实体为主语或宾语的情况下,增加所述候选语义中的语义资源的权重。6.根据权利要求4所述的信息处理装置,其中,所述权重分配子单元被配置为将包含所述周边实体的语义的权重设置为大于不包含所述周边实体的语义的权重。7.根据权利要求4所述的信息处理装置,其中,所述更新单元被配置为基于所述用户从排序后的候选语义中选择的与所述实体对应的语义,对所述候选语义的权重进行更新。8.根据权利要求7所述的信息处理装置,其中,所述更新单元被配置为基于所述用户所做的选择的统计信息来更新所述候选语义的权重。9.根据权利要求7所述的信息处理装置,其中,所述更新单元被配置为基于所述用户为所述实体选择语义本体的次数和为所述实体选择语义资源的次数的比值来更新所述候选语义的权重。10.一种用于对实体进行语义化的信息处理方法,包括:计算实体与语义之间的关联度;
根据所计算的所述关联度以及基于所述实体的上下文的排序权重,对所述语义进行排序;以及
根据用户基于所述排序对与所述实体对应的语义的选择,对排序中使用的所述排序权重进行更新。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611114803.5/,转载请声明来源钻瓜专利网。