[发明专利]一种通用实体链接装置及方法有效
申请号: | 201810906847.4 | 申请日: | 2018-08-10 |
公开(公告)号: | CN109165297B | 公开(公告)日: | 2021-12-24 |
发明(设计)人: | 花京华;刘军宁;徐常亮 | 申请(专利权)人: | 新华智云科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36 |
代理公司: | 杭州橙知果专利代理事务所(特殊普通合伙) 33261 | 代理人: | 李品 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 通用 实体 链接 装置 方法 | ||
1.一种通用实体链接装置,其特征在于:包括
-信息封装模块,用于接收待识别实体,并将待识别实体的上下文信息进行封装形成带有业务场景字段的实体封装;
-实体链接模组,连接信息封装模块,实体链接模组内设有多个用于链接实体的链接流水线,不同的链接流水线适用于不同的业务场景;
-流程选择模块,连接信息封装模块和实体链接模组,用于根据实体封装中的业务场景字段选择适用不同业务场景的链接流水线;
-结果输出模块,连接实体链接模组,用于输出完成实体链接的链接结果;
所述实体链接模组包括
-文本预处理模块,用于对待识别实体文本进行NLP过程统一化处理;
-共指消解模块,当实体指称列表中存在同一实体对应多个指称时,用于确定实体指称的唯一指称;
-实体排序模块,用于将待识别实体中同一实体指称对应的候选实体按照业务场景进行打分排序;
-链接判断模块,用于判断实体指称是否和排序打分后打分最高的候选实体进行链接;
-实体输出模块,按所在的业务场景输出不同格式的链接结果。
2.根据权利要求1所述的通用实体链接装置,其特征在于:所述实体链接模组还包括多个用于不同场景的场景链接单元,所述场景链接单元包括多个应用于不同场景的功能模块,所述文本预处理模块、共指消解模块、实体排序模块、场景链接单元、链接判断模块以及实体输出模块依次连接组成一个应用于不同场景的链接流水线。
3.根据权利要求2所述的通用实体链接装置,其特征在于:所述场景链接单元包括
新闻链接单元,用于链接新闻场景中的待识别实体中的实体指称;
检索链接单元,用于链接检索场景中的待识别实体中的实体指称;
聊天链接单元,用于链接机器人聊天场景中的待识别实体中的实体指称。
4.根据权利要求3所述的通用实体链接装置,其特征在于:所述功能模块为白名单模块、黑名单模块、新闻过滤模块、用户交互重排序模块、垂直领域重排序模块、实体检索模块以及实体特征获取模块,所述场景链接单元为多个功能模块中的一种或几种的组合;其中,
白名单模块,用于储存进入白名单的实体;
黑名单模块,用于储存进入黑名单的实体;
新闻过滤模块,用于过滤待识别实体中的干扰信息;
用户交互重排序模块,用于根据用户交互上下文和实体近期热度对实体指称相应的候选实体进行重新排序;
垂直领域重排序模块,用于根据垂直领域对实体指称相应的候选实体进行重新排序。
5.根据权利要求1所述的通用实体链接装置,其特征在于:还包括实体特征获取模块,用于批量读取待识别实体中的特征,所述特征包括实体的infobox信息、摘要或正文的标签词以及实体页面的统计信息。
6.根据权利要求1-5中任意一项所述的通用实体链接装置,其特征在于:实体链接装置中的各个模块的接口为统一设置。
7.根据权利要求1所述的通用实体链接装置,其特征在于:还包括流水线组装模块,用于根据业务场景将各个模块组装成适用不同业务场景的链接流水线。
8.一种通用实体链接方法,其特征在于:包括
S1:将待识别实体的上下文信息进行封装成实体封装;
S2:根据实体封装中的业务场景字段选择不同业务场景对应的链接流水线;
S3:依照选择出的链接流水线对待识别实体进行实体链接处理;
S4:输出实体链接结果;
步骤S3中所述的依照选择出的链接流水线对待识别实体进行实体链接处理包括:
对待识别实体文本进行NLP过程统一化处理;
当实体指称列表中存在同一实体对应多个指称时,进行共指消解确定实体指称的唯一指称;
根据选择出的链接流水线的业务场景对待识别实体进行处理;
将待识别实体中同一实体指称对应的候选实体按照业务场景进行打分排序;
判断实体指称是否和排序打分后打分最高的候选实体进行链接,如能链接则将该实体指称与候选实体进行连接;
按照该链接流水线的业务场景输出不同格式的链接结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新华智云科技有限公司,未经新华智云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810906847.4/1.html,转载请声明来源钻瓜专利网。