[发明专利]基于深度语义模型与语义角色标注的句子相似度评估方法在审
申请号: | 201710876254.3 | 申请日: | 2017-09-25 |
公开(公告)号: | CN107818081A | 公开(公告)日: | 2018-03-20 |
发明(设计)人: | 周俏丽;杨凤玲 | 申请(专利权)人: | 沈阳航空航天大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 沈阳优普达知识产权代理事务所(特殊普通合伙)21234 | 代理人: | 李晓光 |
地址: | 110136 辽宁省沈*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 语义 模型 角色 标注 句子 相似 评估 方法 | ||
1.一种基于深度语义模型与语义角色标注的句子相似度评估方法,其特征在于包括以下步骤:
1)建立深度语义模型:将文本字符串映射到低语义空间中的特征向量,获取每个句子的语义特征向量之后,利用余弦相似度来度量两个句子之间的相似度;
2)语义角色分类处理:A0、A1、A2已有的语义角色进行保留,其他的语义角色统一作为一类语义角色进行处理;A0、A1、A2均为公开的语义角色标识;
3)谓词相似度计算:在语义角色分类基础上,针对多谓词句子,根据谓词之间的相似度的大小对句子对进行谓词的配对,得到谓词匹配对,分别针对多个谓词匹配对进行语义角色的计算,得到语义角色之间的相似计算值;
4)基于语义角色的句子相似度计算:根据语义角色之间相似度计算值将一个句子的多个谓词中每一个谓词的多个语义角色进行语义搭配,计算语义角色的相似度,即转化为谓词之间以及相同语义角色之间的相似度计算;
5)句子相似度计算:将深度语义模型计算出的相似度和基于语义角色计算出的相似度两部分进行线性组合作为句子的最终相似度。
2.根据权利要求1所述的基于深度语义模型与语义角色标注的句子相似度评估方法,其特征在于:深度语义模型模型包括词哈希层、隐藏层以及输出层三部分,各个层的函数如下所示:
l1=W1x(1)
li=f(Wili-1+bi),i=2,...,N-1(2)
y=f(WNlN-1+bN)(3)
其中,x为输入向量,y为输出向量,li,i=1,...,N-1为隐藏层的输出,Wi表示第i权重,bi表示第i个偏置,f(*)表示tanh激活函数;
由词哈希层生成的特征向量通过隐藏层进行投影,并在输出层形成语义特征向量;
在获取了每个句子的语义特征向量之后,利用余弦相似度来度量两个句子之间的语义相似性。
3.根据权利要求1所述的基于深度语义模型与语义角色标注的句子相似度评估方法,其特征在于:谓词配对方法如下:
通过DSSM模型进行计算句子A中第i个谓词和句子B中第j个谓词之间的相似度为Sij,得到两个句子谓词之间两两之间的相似度矩阵N:
其中n、m分别为两个句子中谓词的个数;
谓词配对的具体算法如下:
301)按行搜索矩阵N中的所有元素,找到相似度最大的元素,作为句子A和句子B第一个谓词匹配对;
302)删除相似度最大的元素所对应的行与列,保证每一个谓词只与另一个谓词唯一配对;
303)将剩下的元素放在一起作为一个新的矩阵Ni,判断中元素是否为空,若是,则谓词配对结束,否则继续执行步骤301),直到所有谓词都找到唯一的配对谓词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于沈阳航空航天大学,未经沈阳航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710876254.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:术语识别方法及装置
- 下一篇:结合短语结构树的语义角色识别方法