[发明专利]因果关系识别装置及存储介质有效
申请号: | 201780061597.2 | 申请日: | 2017-09-28 |
公开(公告)号: | CN109791569B | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 卡纳萨·库恩卡莱;桥本力;鸟泽健太郎;朱利安·克洛埃特泽;吴钟勋;田仲正弘 | 申请(专利权)人: | 国立研究开发法人情报通信研究机构 |
主分类号: | G06F40/20 | 分类号: | G06F40/20;G06F16/242;G06F40/289;G06N5/01;G06N5/02;G06N3/04;G06N3/045;G06F16/33;G06N5/022;G06F40/30 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 王亚爱 |
地址: | 日本国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 提供一种无论线索词存在与否,能够以高精度识别因果关系表达的因果关系识别装置。因果关系识别装置(30)包括:候补矢量生成部(50),接受因果关系候补(32),并生成表示构成该候补的单词序列的候补矢量;上下文矢量生成部(52),生成表示上下文的上下文矢量,在所述上下文中,出现因果关系候补的原因部的名词词组和结果部的名词词组;二进制模式矢量生成部(54)、回答矢量生成部(56)以及与背景知识有关的关联段落矢量生成部(58),生成表示背景知识的单词矢量,所述背景知识用于判断原因部中包括的名词词组和结果部中包括的名词词组之间有无因果关系;以及多列卷积神经网络(60),预先学习完毕,使得接受这些单词矢量,并判断因果关系候补是否为因果关系。 | ||
搜索关键词: | 因果关系 识别 装置 存储 介质 | ||
【主权项】:
1.一种因果关系识别装置,自动识别由在文本中找到的第一短语以及第二短语表示的因果关系,其中,所述第一短语是所述因果关系的原因部的候补,所述第二短语是所述因果关系的结果部的候补,所述第一短语以及所述第二短语均包括名词词组和谓语的组合,所述因果关系识别装置包括:第一矢量生成单元,接受由所述第一短语以及第二短语构成的因果关系候补,并生成分别表示构成该因果关系候补的单词序列的第一单词矢量的组;第二矢量生成单元,生成分别表示构成上下文的单词序列的第二单词矢量,在所述上下文中,所述第一短语以及所述第二短语出现在所述文本中;背景知识矢量生成单元,用于生成表示背景知识的单词矢量,所述背景知识用于判断所述第一短语中包括的名词词组和第二短语中包括的名词词组之间有无因果关系;以及分类单元,预先学习完毕,使得接受所述第一单词矢量以及所述第二单词矢量和由所述背景知识矢量生成单元生成的单词矢量,并输出指标,所述指标为:成为了这些单词矢量的源的所述因果关系候补是因果关系,所述背景知识矢量生成单元至少包括以下任一个单元的任意的组合:第三矢量生成单元,从大量的文档中收集模式,并生成表示该模式的单词序列的第三单词矢量,所述模式包括所述第一短语中包括的名词词组、所述第二短语中包括的名词词组、以及连接这些名词词组的谓语;第四矢量生成单元,根据所述因果关系候补生成为什么型提问,从为什么型问答装置接受对于该为什么型提问的回答的集合,并根据该回答的集合中包括的回答当中的、均包括所述第一短语中包括的名词词组以及所述第二短语中包括的名词词组的回答,生成第四单词矢量,所述第四单词矢量表示至少包括所述第一短语中包括的名词词组以及所述第二短语中包括的名词词组的单词序列;以及第五矢量生成单元,从大量的文档中存在的、连续的给定个数的句子的组,即所述第一短语中包括的名词词组以及所述第二短语中包括的名词词组与关联于因果关系的线索词具有搭配关系的段落,生成第五单词矢量,所述第五单词矢量表示连结所述第一短语以及所述第二短语中包括的名词词组、在该句子的组内表示两者的依赖关系的单词、以及该句子的组中包括的所述线索词所获得的单词序列。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国立研究开发法人情报通信研究机构,未经国立研究开发法人情报通信研究机构许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201780061597.2/,转载请声明来源钻瓜专利网。