[发明专利]一种基于知识驱动的查询的实体链接方法在审

专利信息
申请号: 201911236844.5 申请日: 2019-12-05
公开(公告)号: CN110888946A 公开(公告)日: 2020-03-17
发明(设计)人: 韩伟红;徐菁;陈雷霆;孙燕;刘妙玲 申请(专利权)人: 电子科技大学广东电子信息工程研究院
主分类号: G06F16/28 分类号: G06F16/28;G06F40/295;G06F40/284
代理公司: 天津市北洋有限责任专利代理事务所 12201 代理人: 潘俊达;郭宝煊
地址: 523000 广东省东莞市*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 知识 驱动 查询 实体 链接 方法
【说明书】:

发明属于实体链接的技术领域,具体涉及一种基于知识驱动的查询的实体链接方法,包括如下步骤,步骤一、基于句法分析,识别用户查询语句中的命名性实体指称项;步骤二、基于增量证据挖掘,通过外部知识源,对所述实体指称项和本地知识库进行信息扩展;步骤三、采用推理链接算法,对所述实体指称项进行链接处理。本发明能够解决用户查询语句的语境缺乏和描述不规范等问题,并降低对本地知识库的依赖性,还准确实现候选实体的产生和判别,从而提高实体链接的性能。

技术领域

本发明属于实体链接的技术领域,具体涉及一种基于知识驱动的查询的实体链接方法。

背景技术

随着web应用程序中对话界面越来越流行,交互越来越类似于自然语言对话,使得自然语言理解变成了一个关键问题。深层次的语义理解对于通过自然语言在普适计算设备中提高信息交换的精度,上下文和个性化是十分必要的。对于用户查询数据进行实体消歧研究,有助于准确理解用户真正的搜索意图,为实现语义搜索打下基础。此外,用户查询数据中包含类别丰富的实体指称项,为知识图谱的构建和更新提供强大的实体支撑。

然而,和新闻、博客等文本数据相比,用户查询语句的构建者是广大群众,由于学识、习惯等问题,质量参差不齐。用户查询语句书写随意,容易出现词序颠倒、拼写错误、多种语言融合、名称变形等多种问题。此外,由于搜索引擎对查询的字数限制,导致查询语句描述简洁,缺乏语境信息。这些特点使得适用于长文本的实体链接方法无法直接应用到用户查询语句中。实体链接系统中必不可少的一个模块是搜索知识库中实体,为实体指称项产生候选实体列表,采用的方法主要是名称匹配,然而名称不规范问题会降低实体指称项和知识库中实体的名称相似度,从而导致遗漏真正的目标链接实体。此外,候选实体排序模块需要利用语境信息来度量实体指称项和候选实体的相关性,而用户查询的语境缺乏问题,会降低实体指称项与目标链接实体的语境相似度,从而无法实现对候选实体的精准判别。比如,给定一条用户查询语句“大衣哥最新视频”,其中实体指称项“大衣哥”指代的真实世界中的实体是农民歌手“朱之文”,很明显它们的名称完全不同,且查询语句中没有提供有效的辨别信息,仅根据该条用户查询语句,无法完成“大衣哥”和“朱之文”之间的链接。

发明人发现现有的面向用户查询的实体链接方法存在以下缺陷:用户查询语句的语境缺乏和存在描述不规范等问题。

发明内容

本发明的目的在于:针对现有技术的不足,提供一种基于知识驱动的查询的实体链接方法,能够解决用户查询语句的语境缺乏和描述不规范等问题,并降低对本地知识库的依赖性,还准确实现候选实体的产生和判别,从而提高实体链接的性能。

为了实现上述目的,本发明采用如下技术方案:

一种基于知识驱动的查询的实体链接方法,包括如下步骤:

步骤一、基于句法分析,识别用户查询语句中的命名性实体指称项;

步骤二、基于增量证据挖掘,通过外部知识源,对所述实体指称项和本地知识库进行信息扩展;

步骤三、采用推理链接算法,对所述实体指称项进行链接处理。

需要说明的是,本发明的实体链接方法中,首先,基于句法分析制定启发式方法,识别用户查询语句中的命名性实体指称项,这样融入了少量的深层和浅层的句法知识,减缓了分词错误造成的影响,有助于提高实体指称项识别的准确性和完整性;其次,针对用户查询语句语境缺乏、实体指称项描述不规范,以及本地知识库实体知识不完善等问题,基于增量证据挖掘的思想,借助百度搜索和百度百科等外部知识源,对实体指称项和本地知识库进行信息扩展,有助于更准确地产生和判别候选实体;最后,通过推理链接算法,该算法通过综合考虑并逐步利用实体多方面的知识,实现了不以牺牲计算成本为代价来提高实体链接性能的目标。

作为本发明所述的一种基于知识驱动的查询的实体链接方法的一种改进,所述步骤三中,所述推理链接算法包括:产生候选实体;对所述候选实体进行排序;预测空链接指称项。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学广东电子信息工程研究院,未经电子科技大学广东电子信息工程研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911236844.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top