[发明专利]一种结合正反向实例的卷积神经网络关系分类方法在审

专利信息
申请号: 201710354990.2 申请日: 2017-06-19
公开(公告)号: CN107194422A 公开(公告)日: 2017-09-22
发明(设计)人: 赵翔;李博;葛斌;肖卫东;王帅;汤大权 申请(专利权)人: 中国人民解放军国防科学技术大学
主分类号: G06K9/62 分类号: G06K9/62;G06N3/08
代理公司: 北京中济纬天专利代理有限公司11429 代理人: 陆薇薇
地址: 410073 湖*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 结合 反向 实例 卷积 神经网络 关系 分类 方法
【说明书】:

技术领域

发明涉及关系抽取和分类技术领域,特指一种结合正向实例和反向实例结合的基于卷积神经网络的关系分类方法。

背景技术

目前在世界范围内已有的关系抽取技术主要可以分为3种:基于模式匹配的方法、基于机器学习的关系抽取方法和开放域信息抽取方法。基于模式匹配的方法利用人工构建的模式匹配关系,需要人工设计模式其领取迁移性差;开放域信息抽取方法抽取一定句子谓语作为主语和宾语之间的关系字符串,然后将关系字符串聚类得到关系,该方法抽取准确度差且抽取出的关系难以映射到构建数据库需要的关系。而基于机器学习的关系抽取技术将抽取问题转化为已知预定义关系类型下的关系分类问题,其保证了抽取准确性并仅有很少的人工干预。

而基于机器学习的关系抽取技术主要分为3种:基于特征的关系分类方法、基于树核的关系分类方法和基于网络的关系分类方法。基于特征的方法抽取大量语言学(词义和语法)特征,组合特征形成特征向量并利用各类分类器(例如最大熵模型和支持向量机等)进行分类得到目标关系,其需要专家设计特征,难以迁移领域。基于树核的方法将文本通过语法树表示,通过设计核函数得到两句子在高维稀疏空间上的内积作为其结构化特征,该方法核函数提取特征局限性大,分

另外,国内外基于神经网络的关系分类算法的代表性工作主要包括,基于卷积神经网络的方法(CNN)[1],基于排序卷积神经网络的方法(CR-CNN)[2],基于递归神经网络的方法(RNN)[3],基于带注意力的双向长短时记忆模型的方法(ATT-BLSTM)[4]等方法。这些方法都是将待抽取关系的句子和实体输入神经网络,利用神经网络获取特征后分类到预定义关系类型,来得到目标关系。

和本发明最接近的是基于卷积神经网络的方法[1](如图1),它利用外部训练的词向量和表示词语与实体距离的位置向量结合得到词语向量,结合句子中所有词语向量作为句子向量,然后将句子向量输入卷积神经网络,利用卷积层获取局部特征,利用池化层得到明显特征,之后经过softmax层得到分类关系。

现有技术中的关系分类方法主要存在以下不足:基于特征的关系分类方法需要人工设计特征,迁移性差;基于树核的方法只能通过定义核函数获取特征,特征单一;而基于神经网络的方法中CNN(卷积神经网络)便于实现且训练效率高,分类效果好,而其他更复杂的方法训练效率较低且难以取得和CNN相当的分类效果。但其仍然法仍存在如下方面的问题:同一句子中实体对按照不同的先后顺序输入神经网络,其分类结果可能不同。例如,在“Financial stress is one of the main causes of divorce。”中,将实体“stress”作e1、实体“divorce”作e2得到结果为Cause-Effect;将“stress”作e2、“divorce”作e1理应得到结果Effect-Cause;但实际分类过程中存在两种结果不对应的情况。

[1]Zeng D,Liu K,Lai S,Zhou G,Zhao J。Relation Classification via Convolutional Deep Neural Network[C]//COLING。2014:2335-2344。

[2]Santos C N,Xiang B,Zhou B。Classifying relations by ranking with convolutional neural networks[C]//ACL(1)。2015:626-634

[3]Hashimoto K,Miwa M,Tsuruoka Y,Chikayama T。Simple Customization of Recursive Neural Networks for Semantic Relation Classification[C]//EMNLP。2013:1372-1376。

[4]Zhou P,Shi W,Tian J,Qi Z,Li B,Hao H,Xu B。Attention-based bidirectional long short-term memory networks for relation classification[C]//ACL(2)。2016:207。

发明内容

本发明的目的在于克服上述现有技术的不足,提出基于卷积神经网络的正向反向实例结合的关系分类方法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科学技术大学,未经中国人民解放军国防科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710354990.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top