[发明专利]注解辅助装置及记录介质有效
申请号: | 201680006728.2 | 申请日: | 2016-01-20 |
公开(公告)号: | CN107209759B | 公开(公告)日: | 2020-09-18 |
发明(设计)人: | 饭田龙;鸟泽健太郎;桥本力;吴钟勋;大竹清敬;木俵丰 | 申请(专利权)人: | 国立研究开发法人情报通信研究机构 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F40/169 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 李海龙 |
地址: | 日本国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 注解 辅助 装置 记录 介质 | ||
提供一种能够容易且低成本地构筑对文本的注解的注解辅助装置。注解数据生成辅助系统(160)包括:输入输出装置(202),通过对话型处理来接受输入;词素解析系统(380)以及依存关系解析系统(382),对文本档案(192)的文本数据进行词素解析以及依存解析;第1~第4候补生成部(388、390、392以及394),在词素串中的谓语的依存关系中检测省略或者指示语,确定注解处理的对象位置,使用语言知识来推定所插入的表达的候补;候补DB(386),存储所推定出的候补;和对话型注解装置(396),从候补DB(386)读出注解处理的候补,将通过输入输出装置(202)的对话型处理而选择出的候补附加为注解。
技术领域
本发明涉及自然语言处理技术,尤其是涉及用于对文本有效地进行针对自然语言的语句中频繁出现的省略、代词等指示语的照应关系的注解的注解辅助装置。
背景技术
在自然语言的文本中,频繁出现省略以及指示语。例如考虑图1所示的例句30。例句30包括第一句和第二句。在第二句中包含「其」这一指示语(代词)42。在该情况下,「其」这一指示语指代第一句的「农历新年的日期」这一表达40。将如此确定指示语所指代的词语的处理称为「照应解析」。另一方面,考虑图2的例句60。该例句60包括第一句和第二句。在第二句中,省略了「搭载自诊断功能」这一谓语部分的主语,在该主语的省略位置76,省略了第一句的「新型交换机」这一单词72。同样地,省略了「预定设置200系统。」这一谓语部分的主语。在该主语的省略位置74,省略了第一句的「N公司」这一单词70。将如此检测主语等的省略并且对其进行补足的处理称为「省略解析」。以后,将照应解析和省略解析一起称为「照应/省略解析」。
在所谓的人工智能中,为了取得与人的交流,自然语言处理是不可缺少的技术。作为自然语言处理的重要的问题,存在自动翻译以及问题解答等。照应/省略解析的技术,在这种自动翻译以及问题解答中是必不可少的技术。但是,现状的照应/省略解析的技术水平,虽然也根据语言而不同,但是还未达到实用级别。
如此,照应/省略解析的性能不能提高的理由,可以考虑各种理由。作为主要的理由,可以列举在这种解析中需要一般常识。为了考虑一般常识,需要考虑与照应/解析相关的人的判断。但是,考虑了这样的要素的解析算法比较困难。归根到底,需要准备大量人的判断作为学习数据,生成通过统计学习来进行照应/省略解析的解析器。但是,已知用于生成这样的解析器构筑用的学习数据的成本是非常大的。因此,由于不能生成足够量的学习数据,所以难以实现照应/省略解析的性能的提高。
为了提高自然语言处理的性能,进而使人工智能更智能,需要解决与照应/省略解析相关的这样的问题。
作为生成照应/省略解析器的学习数据的技术,存在后述的非专利文献1所记载的技术。在该技术中,如以下那样进行学习数据的生成。即,进行如下作业:人从开头开始阅读文本,人工检测代词以及省略等。作为机械的支援,例如是预先列举照应关系的指代目标的表达的程度。
另一方面,在后述的非专利文献2中,公开了自动地按一定的步骤进行照应/省略解析的照应/省略解析算法。该文献所公开的技术,利用词素解析、语法/依存解析(以下简称为「依存解析」)等所输出的信息、和词典等外部资源工具。这里所利用的词典,是汇集了如下特性的词典,即,例如「吃」这一动词的宾语中包括相当于「食物」的表达。在非专利文献2所公开的技术中,除此之外,还参考从文本中得到的信息来进行代词的指代目标以及省略的补足。
在先技术文献
非专利文献
非专利文献1:饭田龙、小町守、井之上直也、乾健太郎、松本裕治、谓语构造和照应关系的注解:NAIST从文本语料库构筑的经验到自然语言处理(述语耩造と照応関係のアノテーション:NAISTテキストコーパス耩築の経験から、自然言語処理),Vol.17,No.2,pp.25-50,2010.
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国立研究开发法人情报通信研究机构,未经国立研究开发法人情报通信研究机构许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680006728.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种智能化自动转换开关
- 下一篇:一种地电阻率垂直观测装置