[发明专利]二元关系提取装置、使用二元关系提取处理的信息检索装置、二元关系提取处理方法、使用二元关系提取处理的信息检索处理方法、二元关系提取处理程序、以及使用二元关系提取处理的信息检索处理程序无效
申请号: | 200680022356.9 | 申请日: | 2006-06-23 |
公开(公告)号: | CN101253497A | 公开(公告)日: | 2008-08-27 |
发明(设计)人: | 村田真树;三森智裕;土井晃一;福田安志 | 申请(专利权)人: | 独立行政法人情报通信研究机构 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中国专利代理(香港)有限公司 | 代理人: | 王岳;刘宗杰 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种针对复杂的问题也能够高性能地提取二元关系的装置。解答-特性对提取部(12)从保存着包含在文本数据中出现的二元关系中赋予了表示其是应提取的内容的解答的事例的教师数据的教师数据存储部(11)中提取事例的特性,生成特性的集合和解答的组。机器学习部(13)利用预定的机器学习方法,对该组在何种特性集合的情况下会形成何种解答这一问题进行机器学习,并将学习结果信息保存到学习结果存储部(14)。候选提取部(15)从文本数据(2)中提取二元关系的候选,特性提取部(16)提取二元关系的候选的特性的集合。解答推断部(17)基于学习结果信息推断在二元关系的候选的特性集合的情况下容易形成解答的程度,二元关系提取部(18)根据推断结果提取正的解答的推断程度良好的二元关系的候选。 | ||
搜索关键词: | 二元关系 提取 装置 使用 处理 信息 检索 方法 程序 以及 | ||
【主权项】:
1.一种二元关系提取装置,其特征在于,是一种使用机器学习处理提取计算机可读取的存储装置中所保存的文本数据中所出现的二元关系的处理装置,其具备以下单元:教师数据存储单元,其中保存的教师数据包含的是由问题与解答的组所构成的事例、问题是文本数据中所出现的二元关系、解答是要提取的二元关系;解答-特性对提取单元,用于从上述教师数据存储单元中提取上述事例,针对上述每个事例,提取预定信息作为特性,生成由上述解答和上述所提取的特性的集合构成的组;机器学习单元,其基于预定的机器学习算法,针对上述解答和特性的集合构成的组执行机器学习处理,学习在何种特性集合的情况下会形成上述解答,将表示在上述何种特性集合的情况下会形成上述解答的信息作为学习结果信息保存到学习结果存储单元中;候选提取单元,其从上述存储装置中保存的文本数据中提取上述二元关系的元素,并提取由上述元素所构成的对,将上述提取的对作为二元关系的候选;特性提取单元,其通过执行与上述解答-特性对提取单元所执行的提取处理相同的提取处理,针对上述二元关系的候选,提取上述预定信息作为特性;解答推断单元,其基于上述学习结果存储单元中保存的上述学习结果信息,推断在上述二元关系的候选特性的集合的情况下容易形成上述解答的程度;二元关系提取单元,其在针对上述二元关系的候选容易形成表示其是应提取的二元关系的解答的程度好于预定程度的情况下,选择上述二元关系的候选作为应提取的二元关系。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于独立行政法人情报通信研究机构,未经独立行政法人情报通信研究机构许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200680022356.9/,转载请声明来源钻瓜专利网。