[发明专利]文本含意辨认装置、文本含意辨认方法和计算机可读记录介质有效
申请号: | 201280003691.X | 申请日: | 2012-10-04 |
公开(公告)号: | CN103221947A | 公开(公告)日: | 2013-07-24 |
发明(设计)人: | 土田正明;石川开;大西贵士 | 申请(专利权)人: | 日本电气株式会社 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 杨静 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 含意 辨认 装置 方法 计算机 可读 记录 介质 | ||
1.一种文本含意辨认装置,所述文本含意辨认装置用于确定第一文本是否暗指第二文本,所述文本含意辨认装置包括:
矢量生成单元,所述矢量生成单元获取所述第一文本和所述第二文本中每一个的谓语论元结构,并通过使用除对所述谓语论元结构中的谓语论元的类型加以指示的字词以外的字词,对于所述第一文本和所述第二文本中的每一个生成针对每个所述谓语论元结构的矢量;
组合识别单元,所述组合识别单元将针对所述第一文本的每个所述谓语论元结构生成的所述矢量与针对所述第二文本的每个所述谓语论元结构生成的所述矢量进行比较,并根据比较结果识别所述第一文本的所述谓语论元结构与所述第二文本的所述谓语论元结构的组合;以及
含意确定单元,所述含意确定单元针对识别的每个所述组合获得特征量,并根据获得的所述特征量来确定所述第一文本是否暗指所述第二文本。
2.根据权利要求1所述的文本含意辨认装置,其中所述谓语论元结构包括在所述第一文本或所述第二文本中包含的谓语、用作所述谓语的论元的字词以及对所述论元的类型加以指示的字词,并且
所述矢量生成单元使用所述谓语和用作所述谓语的论元的所述字词来生成所述矢量。
3.根据权利要求1或2所述的文本含意辨认装置,其中所述组合识别单元计算针对所述第一文本的每个所述谓语论元结构生成的所述矢量与针对所述第二文本的每个所述谓语论元结构生成的所述矢量之间的相似度,并根据计算的所述相似度来识别所述第一文本的所述谓语论元结构和所述第二文本的所述谓语论元结构的组合。
4.根据权利要求3所述的文本含意辨认装置,其中所述组合识别单元根据所述矢量的信息量在所述相似度的计算期间执行归一化处理。
5.根据权利要求1-4之一所述的文本含意辨认装置,其中所述含意确定单元针对所述组合中的每一个,根据除对所述谓语论元结构中的谓语论元的类型加以指示的字词以外的字词,来获得所述第一文本的所述谓语论元结构和所述第二文本的所述谓语论元结构之间的字词覆盖程度和仅针对用作所述论元的字词的字词匹配程度之一,作为所述特征量。
6.根据权利要求5所述的文本含意辨认装置,其中除了所述特征量以外,所述含意确定单元还使用所述谓语论元结构的结构特征来确定所述第一文本是否暗指所述第二文本。
7.根据权利要求6所述的文本含意辨认装置,其中所述含意确定单元根据所述第一文本的所述谓语论元结构和所述第二文本的所述谓语论元结构之间的结构相似度,优先考虑所述谓语论元结构的所述特征量和所述结构特征之一来执行确定。
8.根据权利要求5-7之一所述的文本含意辨认装置,其中当获得所述特征量时,所述含意确定单元根据通过机器学习获得的数据向所述特征量添加权重。
9.一种文本含意辨认方法,所述文本含意辨认方法用于确定第一文本是否暗指第二文本,所述文本含意辨认方法包括:
(a)获取所述第一文本和所述第二文本中每一个的谓语论元结构,并使用除对所述谓语论元结构中的谓语论元的类型加以指示的字词以外的字词,对于所述第一文本和所述第二文本中的每一个生成针对每个所述谓语论元结构的矢量;
(b)将针对所述第一文本的每个所述谓语论元结构生成的所述矢量与针对所述第二文本的每个所述谓语论元结构生成的所述矢量进行比较,并根据比较结果识别所述第一文本的所述谓语论元结构与所述第二文本的所述谓语论元结构的组合;以及
(c)针对识别的每个所述组合获得特征量,并根据获得的所述特征量来确定所述第一文本是否暗指所述第二文本。
10.一种计算机可读记录介质,其上记录有用于通过计算机确定第一文本是否暗指第二文本的程序,所述程序包括使所述计算机执行以下步骤的指令:
(a)获取所述第一文本和所述第二文本中每一个的谓语论元结构,并使用除对所述谓语论元结构中的谓语论元的类型加以指示的字词以外的字词,对于所述第一文本和所述第二文本中的每一个生成针对每个所述谓语论元结构的矢量;
(b)将针对所述第一文本的每个所述谓语论元结构生成的所述矢量与针对所述第二文本的每个所述谓语论元结构生成的所述矢量进行比较,并根据比较结果识别所述第一文本的所述谓语论元结构与所述第二文本的所述谓语论元结构的组合;以及
(c)针对识别的每个所述组合获得特征量,并根据获得的所述特征量来确定所述第一文本是否暗指所述第二文本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于日本电气株式会社,未经日本电气株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201280003691.X/1.html,转载请声明来源钻瓜专利网。