[发明专利]生成用于信息领域的自然语言处理模型在审
申请号: | 201280061093.8 | 申请日: | 2012-11-26 |
公开(公告)号: | CN103999081A | 公开(公告)日: | 2014-08-20 |
发明(设计)人: | D·J·麦克洛斯基;D·博尔佩里;D·卡恩斯 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 王茂华 |
地址: | 美国纽*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 生成 用于 信息 领域 自然语言 处理 模型 | ||
1.一种用于生成用于信息领域的自然语言处理模型的方法,包括:
从所述信息领域的源模型(111)得出(101)自然语言词典的框架;
应用(102)定义概念和关系的语法规则的集合;
基于来自所述信息领域的参考文档扩展(103)所述自然语言词典的所述框架,以提供用于所述信息领域的自然语言处理模型,
其中扩展所述框架包括对用于概念和关系的术语聚类和打分。
2.根据权利要求1所述的方法,其中得出(101)自然语言词典的框架使用所述信息领域中的优选术语。
3.根据权利要求1或2所述的方法,其中应用(102)语法规则的集合包括取得主语、谓语、宾语和可变顺序以用于覆盖。
4.根据权利要求1至3中任一项所述的方法,其中扩展(103)所述框架包括:
选择(201)优选术语作为概念或者关系;
在来自所述信息领域的参考文档中执行(202)对所述优选术语的关键字搜索;以及
提供(206)用于所述优选术语的潜在术语的有序集合。
5.根据权利要求4所述的方法,包括:
确定(203)局部n元语法;
测量(204)所述n元语法的一个或者多个度量;以及
对所述n元语法打分(205)。
6.根据前述权利要求中任一项所述的方法,其中扩展(103)所述自然语言词典的所述框架包括:
基于来自所述信息领域的所述参考文档得出进一步的语法规则;以及
对所述语法规则与用于概念和关系的聚类的所述术语求交。
7.根据权利要求6所述的方法,包括:
使用来自动词的语言类的动词结构以驱动向聚类的术语应用的所述交集。
8.根据前述权利要求中任一项所述的方法,其中扩展(103)所述框架开始于起始概念或者关系,并且向外迭代地移出所述源模型中的邻近概念或者关系链接;并且
通过增大分数来细化概念和关系的扩展的所述术语。
9.根据权利要求8所述的方法,包括:
使用分数阈值来确定用于概念或者关系的最佳术语的散度。
10.根据前述权利要求中任一项所述的方法,其中扩展(103)所述框架基于结果动态地改变迭代策略。
11.根据前述权利要求中任一项所述的方法,其中得出(101)自然语言词典的框架是基于多于一个源模型(111)。
12.根据前述权利要求中任一项所述的方法,其中得出(101)自然语言词典的框架利用开放数据以初始地填充所述框架,其中所述源模型的本体类被匹配于开放数据的类。
13.一种在计算机可读介质上存储并且可向数字计算机的内部存储器中加载的计算机程序,包括当所述程序在计算机上运行时用于执行根据权利要求1-12中任一项所述的方法的软件代码部分。
14.一种用于生成用于信息领域的自然语言处理模型的系统,包括:
处理器;
框架部件(311),用于从所述信息领域(320)的源模型(321)得出自然语言词典的框架;
语法规则部件(312),用于应用定义概念和关系的语法规则的集合;
扩展部件(313),用于基于来自所述信息领域(320)的参考文档(322)扩展所述自然语言词典的所述框架,以提供用于所述信息领域的自然语言处理模型(314),其中扩展所述框架包括对用于概念和关系的术语聚类和打分。
15.根据权利要求14所述的系统,其中用于应用语法规则的集合的所述语法规则部件(312)包括取得主语、谓语、宾语和可变顺序以用于覆盖。
16.根据权利要求14或15所述的系统,其中用于扩展所述框架的所述扩展部件(313)包括部件,所述部件包括概念/关系聚类部件(314),用于:
选择优选术语作为概念或者关系;
在来自所述信息领域的参考文档中执行对所述优选术语的关键字搜索;以及
提供用于所述优选术语的潜在术语的有序集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201280061093.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种提高蛇毒产量的毒蛇灌喂饲料
- 下一篇:无线电源系统和方法
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置