[发明专利]一种基于多特征语义树核的关系抽取方法和信息检索方法有效
申请号: | 201310652675.X | 申请日: | 2013-12-05 |
公开(公告)号: | CN104699695B | 公开(公告)日: | 2018-06-19 |
发明(设计)人: | 韩先培;孙乐 | 申请(专利权)人: | 中国科学院软件研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 北京君尚知识产权代理事务所(普通合伙) 11200 | 代理人: | 余长江 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种基于多特征语义树核的关系抽取方法,以及应用该方法进行文本信息检索的方法,属于自然语言处理技术领域。该关系抽取方法主要包含:面向句法分析树关系表述表示的特征扩展机制;基于上述特征扩展机制的句法树内容特征扩展;融合内容特征和句法分析树结构特征的多特征语义树核。面向句法分析树的特征扩展机制将特定关系表述的句法结构和内容特征置于统一的表示框架之中进行表示。句法树特征扩展将关系表述的重要语义信息和内容信息融入到句法树表示中。多特征语义树核提供了一种有效和高性能的算法,可综合关系表述的句法结构和内容特征进行综合判断。 1 | ||
搜索关键词: | 内容特征 特征扩展 特征语义 关系抽取 句法分析树 句法结构 自然语言处理技术 文本信息检索 句法分析 内容信息 信息检索 语义信息 综合判断 树结构 算法 融合 融入 应用 统一 | ||
【主权项】:
1.一种基于多特征语义树核的关系抽取方法,其步骤包括:1)在句法分析树的每一个节点处加入用于表示内容特征的特征向量,以统一表示关系表述的句法结构特征和内容特征;2)对句法分析树中的每一个树节点,抽取表示其内容特性的一系列特征,并将该一系列特征加入到树节点的特征向量中,从而形成多特征扩展句法分析树;3)基于所述多特征扩展句法分析树构建多特征语义树核,通过该多特征语义树核综合利用句法结构特征和内容特征计算不同句法分析树之间的相似度,得到可靠的关系抽取结果;所述相似度采用如下公式计算:其中,T1和T2是待比较的多特征扩展句法分析树,t1和t2是T1和T2的子树,k(t1,t2)是子树t1和t2之间的相似度;其中,k(t1,t2)的采用如下公式计算:其中,δ(t1,t2)是表征t1和t2是否有相同句法结构的指示函数,E(t1,t2)是子树t1和t2的所有对齐节点对;sim(ni,nj)是对齐节点ni和nj之间的相似度,由其特征向量的内积决定。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院软件研究所,未经中国科学院软件研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310652675.X/,转载请声明来源钻瓜专利网。
- 上一篇:显示装置及其驱动方法
- 下一篇:存储器芯片扰码验证方法