[发明专利]一种基于知识库的实体链接系统有效
申请号: | 202310295026.2 | 申请日: | 2023-03-24 |
公开(公告)号: | CN116049447B | 公开(公告)日: | 2023-06-13 |
发明(设计)人: | 张正义;刘羽;傅晓航;国强强 | 申请(专利权)人: | 中科雨辰科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/242;G06F40/295;G06N5/022 |
代理公司: | 北京锺维联合知识产权代理有限公司 11579 | 代理人: | 黄利萍 |
地址: | 100093 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识库 实体 链接 系统 | ||
本申请涉及电数字数据处理技术领域,特别是涉及一种基于知识库的实体链接系统。该系统包括的存储器存储有知识库;该系统还包括处理器和存储有计算机程序的存储介质,当所述计算机程序被处理器执行时,实现以下步骤:S100,对目标文本text进行词性分析,获取csubgt;q/subgt;的词性;S200,如果csubgt;q/subgt;的词性是名词,则获取csubgt;q/subgt;的实体类型
技术领域
本发明涉及电数字数据处理技术领域,特别是涉及一种基于知识库的实体链接系统。
背景技术
实体链接是将文本中的实体链指到维基(wiki)中的唯一地址,链指通过唯一标识符QID实现。实体-QID词典中存储有实体与QID的对应关系,通过在实体-QID词典中匹配文本中的实体的方式,即可获取文本中的实体对应的QID。但是,实体-QID词典中数据量较大,匹配过程耗时较长,如何提高获取文本中实体对应的QID的效率,是亟待解决的问题。
发明内容
本发明目的在于,提供一种基于知识库的实体链接系统,提高了获取文本中实体对应的QID的效率。
根据本发明,提供了一种基于知识库的实体链接系统,包括所述存储器存储有知识库A,A=(A1,A2,…,An,…,AN),An为A包括的第n个子知识库,An的实体类型标签为Ln,n的取值范围为1到N,N为A包括的子知识库的数量;An=(An,1,An,2,…,An,m,…,An,M),An,m为An中第m个实体链接关系,m的取值范围为1到M,M为An包括的实体链接关系的数量;An,m=(en,m,idn,m),en,m为An,m对应的实体,idn,m为en,m对应的链接ID;An的构建方法包括:
S010,获取第一实体e’的别名实体(e’1,e’2,…,e’t,…,e’T),e’t为e’的第t个别名实体,t的取值范围为1到T,T为e’的别名实体的数量。
S020,如果e’的实体类型为Ln对应的实体类型,且An中不存在实体与e’匹配,则将e’对应的实体链接关系存储在An中,并进入S030;如果e’的实体类型为Ln对应的实体类型,且An中存在实体与e’匹配,则不更新An,并进入S030。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科雨辰科技有限公司,未经中科雨辰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310295026.2/2.html,转载请声明来源钻瓜专利网。