[发明专利]使用手动用户反馈进行实体识别和链接系统和方法有效
申请号: | 201780029317.X | 申请日: | 2017-05-09 |
公开(公告)号: | CN109564589B | 公开(公告)日: | 2023-08-04 |
发明(设计)人: | L·B·恩格太里;V·V·马尔沃德 | 申请(专利权)人: | 通用电气公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F16/33;G06F3/04842 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 侯颖媖;钱慰民 |
地址: | 美国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 手动 用户 反馈 进行 实体 识别 链接 系统 方法 | ||
1.一种文本分析方法,包括:
识别概念,其中包括:
接收包括多个实体的文本流,以及
从所述多个实体中提取至少一个概念;
消除所述至少一个被提取概念的歧义,其中包括:
接收所述至少一个被提取概念,以及
生成与所述至少一个被提取概念相对应的至少一个已消除歧义概念,其中所述生成至少一个已消除歧义概念包括:计算表示所述至少一个被提取概念的正确可能性的置信度得分,其中所述计算置信度得分包括加入与以下项中的每一者的比较:多个肯定示例概念和多个否定示例概念,其中所述消除所述至少一个被提取概念的歧义包括将所述至少一个被提取概念与以下项中的每一者进行比较:所述多个肯定示例概念和所述多个否定示例概念;以及
捕获用户反馈,其中包括:
接收所述至少一个已消除歧义概念,
使用从用户接收的第一手动输入验证所述已消除歧义概念,
生成以下项的至少一者:被保留概念和被丢弃概念,
从所述用户接收第二手动输入,以及
基于所述第二手动输入将所述被保留概念添加到以下项中的至少一者:所述多个肯定示例概念和所述多个否定示例概念。
2.根据权利要求1所述的方法,其中所述识别概念进一步包括:
通过应用自然语言处理技术来处理所述多个实体,以生成所述至少一个被提取概念,
生成在与所述被提取概念相关联的多个特征方面与链接到所述至少一个被提取概念的所述多个实体中的至少一个实体相对应的特征向量表示,以及
将所述向量表示与以下项中的至少一者相关联:所述多个肯定示例概念和所述多个否定示例概念。
3.根据权利要求1所述的方法,其中所述接收文本流包括接收非结构化文本流。
4.一种文本分析系统,包括:
概念识别模块,所述概念识别模块配置成:
接收包括多个实体的文本流,并且
从所述多个实体中提取至少一个概念;
概念歧义消除模块,所述概念歧义消除模块包括多个肯定示例概念和多个否定示例概念,所述概念歧义消除模块独立地连接到所述概念识别模块,并且配置成:
接收所述至少一个被提取概念并且为其消除歧义,其中消除所述至少一个被提取概念的歧义包括将所述至少一个被提取概念与以下项中的每一者进行比较:所述多个肯定示例概念和所述多个否定示例概念,并且
生成至少一个对应的已消除歧义概念,其中所述生成至少一个已消除歧义概念包括:计算表示所述至少一个被提取概念的正确可能性的置信度得分,其中所述计算置信度得分包括加入与以下项中的每一者的比较:所述多个肯定示例概念和所述多个否定示例概念;以及
用户反馈模块,所述用户反馈模块连接到所述概念歧义消除模块并且配置成:
从所述概念歧义消除模块接收所述已消除歧义概念,
使用从用户接收的第一手动输入验证所述已消除歧义概念,
生成以下项的至少一者:被保留概念和被丢弃概念,
从所述用户接收第二手动输入,以及
基于所述第二手动输入将所述被保留概念添加到以下项中的至少一者:所述概念歧义消除模块的所述多个肯定示例概念和所述多个否定示例概念。
5.根据权利要求4所述的系统,其中所述概念识别模块进一步包括:
文本处理部件,所述文本处理部件配置成:
通过应用自然语言处理技术来处理所述多个实体,并且
提取至少一个概念,以及
特征向量生成部件,所述特征向量生成部件配置成:
从所述文本处理部件接收所述被提取概念,
生成在与所述被提取概念相关联的多个特征方面与链接到所述至少一个被提取概念的所述多个实体中的至少一个实体相对应的特征向量表示,并且
将所述向量表示与以下项中的至少一者相关联:所述多个肯定示例概念和所述多个否定示例概念。
6.根据权利要求4所述的系统,其中所述文本包括非结构化文本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于通用电气公司,未经通用电气公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780029317.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:学习数据过滤
- 下一篇:信息处理装置和信息处理方法