[发明专利]一种语义相关度的确定方法及确定装置有效
申请号: | 201710188870.X | 申请日: | 2017-03-27 |
公开(公告)号: | CN108664464B | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 游树娟;李小涛;牛亚文 | 申请(专利权)人: | 中国移动通信有限公司研究院;中国移动通信集团公司 |
主分类号: | G06F40/247 | 分类号: | G06F40/247;G06F40/30;G06F40/284 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 朱琳爱义 |
地址: | 100032 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种语义相关度的确定方法及确定装置,该确定方法将word2vec训练模型与同义词词林相结合,通过同义词词林获取一个词的单义词,再基于word2vec的余弦语义相关度计算规则确定两个词语之间的语义相关度,而没有利用同义词词林的语义相关度计算规则,所以该确定方法不仅充分考虑了词语在上下文语境中的语义信息,还有效地解决了同义词、多义词、非邻域词之间的语义相关度计算不准确的问题,大大地提高了各词语之间语义相关度的计算准确性。 | ||
搜索关键词: | 一种 语义 相关 确定 方法 装置 | ||
【主权项】:
1.一种语义相关度的确定方法,其特征在于,包括:在预先采用词向量word2vec训练模型训练获得的词向量中选取第一词语与第二词语,并分别确定所述第一词语与所述第二词语的向量;确定所述第一词语的向量与所述第二词语的向量之间的第一余弦语义相关度;在确定在所述第一词语与所述第二词语中至少有一个属于预设的同义词词林时,确定所述第一词语或所述第二词语属于所述同义词词林且属于所述词向量的单义词的向量与所述第二词语或所述第一词语的向量之间的第二余弦语义相关度;将所述第二余弦语义相关度与所述第一余弦语义相关度中的最大值作为所述第一词语与所述第二词语之间的语义相关度;在确定所述第一词语与所述第二词语均不属于所述同义词词林时,将确定出的所述第一词语的向量与所述第二词语的向量之间的第一余弦语义相关度作为所述第一词语与所述第二词语之间的语义相关度。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信有限公司研究院;中国移动通信集团公司,未经中国移动通信有限公司研究院;中国移动通信集团公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710188870.X/,转载请声明来源钻瓜专利网。