[发明专利]使用手动用户反馈进行实体识别和链接系统和方法有效

专利信息
申请号: 201780029317.X 申请日: 2017-05-09
公开(公告)号: CN109564589B 公开(公告)日: 2023-08-04
发明(设计)人: L·B·恩格太里;V·V·马尔沃德 申请(专利权)人: 通用电气公司
主分类号: G06F40/295 分类号: G06F40/295;G06F16/33;G06F3/04842
代理公司: 上海专利商标事务所有限公司 31100 代理人: 侯颖媖;钱慰民
地址: 美国*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 使用 手动 用户 反馈 进行 实体 识别 链接 系统 方法
【权利要求书】:

1.一种文本分析方法,包括:

识别概念,其中包括:

接收包括多个实体的文本流,以及

从所述多个实体中提取至少一个概念;

消除所述至少一个被提取概念的歧义,其中包括:

接收所述至少一个被提取概念,以及

生成与所述至少一个被提取概念相对应的至少一个已消除歧义概念,其中所述生成至少一个已消除歧义概念包括:计算表示所述至少一个被提取概念的正确可能性的置信度得分,其中所述计算置信度得分包括加入与以下项中的每一者的比较:多个肯定示例概念和多个否定示例概念,其中所述消除所述至少一个被提取概念的歧义包括将所述至少一个被提取概念与以下项中的每一者进行比较:所述多个肯定示例概念和所述多个否定示例概念;以及

捕获用户反馈,其中包括:

接收所述至少一个已消除歧义概念,

使用从用户接收的第一手动输入验证所述已消除歧义概念,

生成以下项的至少一者:被保留概念和被丢弃概念,

从所述用户接收第二手动输入,以及

基于所述第二手动输入将所述被保留概念添加到以下项中的至少一者:所述多个肯定示例概念和所述多个否定示例概念。

2.根据权利要求1所述的方法,其中所述识别概念进一步包括:

通过应用自然语言处理技术来处理所述多个实体,以生成所述至少一个被提取概念,

生成在与所述被提取概念相关联的多个特征方面与链接到所述至少一个被提取概念的所述多个实体中的至少一个实体相对应的特征向量表示,以及

将所述向量表示与以下项中的至少一者相关联:所述多个肯定示例概念和所述多个否定示例概念。

3.根据权利要求1所述的方法,其中所述接收文本流包括接收非结构化文本流。

4.一种文本分析系统,包括:

概念识别模块,所述概念识别模块配置成:

接收包括多个实体的文本流,并且

从所述多个实体中提取至少一个概念;

概念歧义消除模块,所述概念歧义消除模块包括多个肯定示例概念和多个否定示例概念,所述概念歧义消除模块独立地连接到所述概念识别模块,并且配置成:

接收所述至少一个被提取概念并且为其消除歧义,其中消除所述至少一个被提取概念的歧义包括将所述至少一个被提取概念与以下项中的每一者进行比较:所述多个肯定示例概念和所述多个否定示例概念,并且

生成至少一个对应的已消除歧义概念,其中所述生成至少一个已消除歧义概念包括:计算表示所述至少一个被提取概念的正确可能性的置信度得分,其中所述计算置信度得分包括加入与以下项中的每一者的比较:所述多个肯定示例概念和所述多个否定示例概念;以及

用户反馈模块,所述用户反馈模块连接到所述概念歧义消除模块并且配置成:

从所述概念歧义消除模块接收所述已消除歧义概念,

使用从用户接收的第一手动输入验证所述已消除歧义概念,

生成以下项的至少一者:被保留概念和被丢弃概念,

从所述用户接收第二手动输入,以及

基于所述第二手动输入将所述被保留概念添加到以下项中的至少一者:所述概念歧义消除模块的所述多个肯定示例概念和所述多个否定示例概念。

5.根据权利要求4所述的系统,其中所述概念识别模块进一步包括:

文本处理部件,所述文本处理部件配置成:

通过应用自然语言处理技术来处理所述多个实体,并且

提取至少一个概念,以及

特征向量生成部件,所述特征向量生成部件配置成:

从所述文本处理部件接收所述被提取概念,

生成在与所述被提取概念相关联的多个特征方面与链接到所述至少一个被提取概念的所述多个实体中的至少一个实体相对应的特征向量表示,并且

将所述向量表示与以下项中的至少一者相关联:所述多个肯定示例概念和所述多个否定示例概念。

6.根据权利要求4所述的系统,其中所述文本包括非结构化文本。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于通用电气公司,未经通用电气公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201780029317.X/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top