[发明专利]上下文解析装置及上下文解析方法有效

专利信息
申请号: 201280071298.4 申请日: 2012-06-25
公开(公告)号: CN104169909A 公开(公告)日: 2014-11-26
发明(设计)人: 浜田伸一郎 申请(专利权)人: 株式会社东芝;东芝解决方案株式会社
主分类号: G06F17/27 分类号: G06F17/27
代理公司: 永新专利商标代理有限公司 72002 代理人: 徐殿军
地址: 日本*** 国省代码: 日本;JP
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 上下文 解析 装置 方法
【说明书】:

技术领域

本发明涉及进行上下文解析的上下文解析装置及上下文解析方法。

背景技术

照应解析(Anaphora Resolution)、首尾一贯性的解决(Coreference Resolution)、对话处理(Dialog Processing)等上下文解析(Contextual Analysis)在自然语言处理中在正确地理解文书方面是重要的任务。在上下文解析中,已知使用香克(Schank)的脚本(script)或菲尔莫尔(Fillmore)的框架(frame)那样的程序性知识(procedural knowledge)是有效的。但是,在由人工制作的程序性知识方面有覆盖度(coverage)的极限。所以,尝试自动从文书获得这样的程序性知识的途径(approach)。

例如,提出了将相互关联的谓语的序列(以下称作“事件序列(event sequence)”)看作程序性知识、从任意的文书群获得这样的事件序列而作为程序性知识加以利用的方法。

但是,用以往的方法获得的事件序列缺少作为程序性知识的正确性,所以有如果利用它进行上下文解析则不能得到充分的精度的情况,要求改善。

现有技术文献:

专利文献:

非专利文献1:V.Pekar.2006.Acquisition of verb entailment from text.In“Proceedings of the main conference on Human Language Technology Conference of the North American Chapter of the Association of Computational Linguistics”,pages49.56.Association for Computational Linguistic.

非专利文献2:I.Szpektor and I.Dagan.2008.Learning entailment rules for unary templates.In“Proceedings of the 22nd International Conference on Computational Linguistics-Volume 1”,pages 849.856.Association for Computational Linguistics.

非专利文献3:N.Chambers and D.Jurafsky.2009.Unsupervised learning of narrative schemas and their participants.In “Proceedings of the Joint Conference of the 47th Annual Meeting of the ACL and the 4th International Joint Conference on Natural Language Processing of the AFNLP:Volume 2-Volume2”,pages 602.610.Association for Computational Linguistics.

发明内容

本发明要解决的课题是,提供一种能够进行精度较高的上下文解析的上下文解析装置及上下文解析方法。

技术方案的上下文解析装置具备预测序列生成部、概率预测部和解析处理部。预测序列生成部以具有共有项的谓语、确定该谓语的语义的语义确定信息、和表示上述共有项的格的种类的格种类信息的组合为要素,从解析对象的文书生成预测序列,该预测序列是通过预测而求出了排列有多个该要素的序列的一部分要素的序列;概率预测部基于从任意的文书群事先获得的与上述预测序列一致的上述序列的出现概率,预测上述预测序列的发生概率;解析处理部使用预测到的上述预测序列的发生概率,进行对解析对象的文书的上下文解析。

附图说明

图1是说明英语的句间照应(inter-sentential anaphora)的一例的图。

图2是说明通过以往的方法获得的事件序列的具体例的图。

图3是说明通过以往的方法获得的事件序列的问题的图。

图4是将京都大学格框架的一部分摘录表示的图。

图5是表示实施方式的上下文解析装置的结构例的框图。

图6是说明带有照应标记的文书群的一例的图。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝;东芝解决方案株式会社,未经株式会社东芝;东芝解决方案株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201280071298.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top