[发明专利]生成用于信息领域的自然语言处理模型在审

专利信息
申请号: 201280061093.8 申请日: 2012-11-26
公开(公告)号: CN103999081A 公开(公告)日: 2014-08-20
发明(设计)人: D·J·麦克洛斯基;D·博尔佩里;D·卡恩斯 申请(专利权)人: 国际商业机器公司
主分类号: G06F17/27 分类号: G06F17/27
代理公司: 北京市金杜律师事务所 11256 代理人: 王茂华
地址: 美国纽*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 生成 用于 信息 领域 自然语言 处理 模型
【权利要求书】:

1.一种用于生成用于信息领域的自然语言处理模型的方法,包括:

从所述信息领域的源模型(111)得出(101)自然语言词典的框架;

应用(102)定义概念和关系的语法规则的集合;

基于来自所述信息领域的参考文档扩展(103)所述自然语言词典的所述框架,以提供用于所述信息领域的自然语言处理模型,

其中扩展所述框架包括对用于概念和关系的术语聚类和打分。

2.根据权利要求1所述的方法,其中得出(101)自然语言词典的框架使用所述信息领域中的优选术语。

3.根据权利要求1或2所述的方法,其中应用(102)语法规则的集合包括取得主语、谓语、宾语和可变顺序以用于覆盖。

4.根据权利要求1至3中任一项所述的方法,其中扩展(103)所述框架包括:

选择(201)优选术语作为概念或者关系;

在来自所述信息领域的参考文档中执行(202)对所述优选术语的关键字搜索;以及

提供(206)用于所述优选术语的潜在术语的有序集合。

5.根据权利要求4所述的方法,包括:

确定(203)局部n元语法;

测量(204)所述n元语法的一个或者多个度量;以及

对所述n元语法打分(205)。

6.根据前述权利要求中任一项所述的方法,其中扩展(103)所述自然语言词典的所述框架包括:

基于来自所述信息领域的所述参考文档得出进一步的语法规则;以及

对所述语法规则与用于概念和关系的聚类的所述术语求交。

7.根据权利要求6所述的方法,包括:

使用来自动词的语言类的动词结构以驱动向聚类的术语应用的所述交集。

8.根据前述权利要求中任一项所述的方法,其中扩展(103)所述框架开始于起始概念或者关系,并且向外迭代地移出所述源模型中的邻近概念或者关系链接;并且

通过增大分数来细化概念和关系的扩展的所述术语。

9.根据权利要求8所述的方法,包括:

使用分数阈值来确定用于概念或者关系的最佳术语的散度。

10.根据前述权利要求中任一项所述的方法,其中扩展(103)所述框架基于结果动态地改变迭代策略。

11.根据前述权利要求中任一项所述的方法,其中得出(101)自然语言词典的框架是基于多于一个源模型(111)。

12.根据前述权利要求中任一项所述的方法,其中得出(101)自然语言词典的框架利用开放数据以初始地填充所述框架,其中所述源模型的本体类被匹配于开放数据的类。

13.一种在计算机可读介质上存储并且可向数字计算机的内部存储器中加载的计算机程序,包括当所述程序在计算机上运行时用于执行根据权利要求1-12中任一项所述的方法的软件代码部分。

14.一种用于生成用于信息领域的自然语言处理模型的系统,包括:

处理器;

框架部件(311),用于从所述信息领域(320)的源模型(321)得出自然语言词典的框架;

语法规则部件(312),用于应用定义概念和关系的语法规则的集合;

扩展部件(313),用于基于来自所述信息领域(320)的参考文档(322)扩展所述自然语言词典的所述框架,以提供用于所述信息领域的自然语言处理模型(314),其中扩展所述框架包括对用于概念和关系的术语聚类和打分。

15.根据权利要求14所述的系统,其中用于应用语法规则的集合的所述语法规则部件(312)包括取得主语、谓语、宾语和可变顺序以用于覆盖。

16.根据权利要求14或15所述的系统,其中用于扩展所述框架的所述扩展部件(313)包括部件,所述部件包括概念/关系聚类部件(314),用于:

选择优选术语作为概念或者关系;

在来自所述信息领域的参考文档中执行对所述优选术语的关键字搜索;以及

提供用于所述优选术语的潜在术语的有序集合。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201280061093.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top