[发明专利]远程监督关系提取器在审
申请号: | 201580053565.9 | 申请日: | 2015-10-01 |
公开(公告)号: | CN107077463A | 公开(公告)日: | 2017-08-18 |
发明(设计)人: | A·夏尔马;张见闻;S·阿罗尼超;柳元沇;汪瑜婧 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
代理公司: | 北京市金杜律师事务所11256 | 代理人: | 王茂华,丁君军 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 提供了一种自动关系提取。使用从大型未标记的数据集建立的统计实体类型预测和关系预测模型的机器学习方法与最小人类介入和基于轻模式的方法交互式地被组合,以从非结构化、半结构化和结构化文档提取关系。通过将针对来自现有事实数据库的已知实体的真相与描述已知实体的文档中的文本相匹配来从未标记的文档的集合收集训练数据,并且针对一个或多个关系类型建立对应的模型。对于建模的关系类型而言,在文档中找到感兴趣的文本数据块。机器学习分类器预测文本数据块之一是正被寻找的实体的概率。组合的机器学习和基于轻模式的方法通过过滤提供经改进的召回率和高精度并且允许所提取的关系的约束和归一化。 | ||
搜索关键词: | 远程 监督 关系 提取 | ||
【主权项】:
一种用于从非结构化文本自动地提取关系的方法,所述方法包括:选择描述在具有实体类型的主题与具有对象类型的对象之间的关系的关系类型;在所选文档中定位对所述对象类型的提及;对于在所述所选文档中被定位的每个提及,使用统计模型预测所述提及满足所述关系类型的概率,所述统计模型使用自动标记的训练数据被建立;以及从所述所选文档提取满足所述关系类型的一个或多个关系。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201580053565.9/,转载请声明来源钻瓜专利网。
- 上一篇:扬声器测试装置
- 下一篇:无线通信耳机检测装置和方法