[发明专利]一种基于知识库的实体链接系统有效
申请号: | 202310295026.2 | 申请日: | 2023-03-24 |
公开(公告)号: | CN116049447B | 公开(公告)日: | 2023-06-13 |
发明(设计)人: | 张正义;刘羽;傅晓航;国强强 | 申请(专利权)人: | 中科雨辰科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/242;G06F40/295;G06N5/022 |
代理公司: | 北京锺维联合知识产权代理有限公司 11579 | 代理人: | 黄利萍 |
地址: | 100093 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识库 实体 链接 系统 | ||
1.一种基于知识库的实体链接系统,其特征在于,包括存储器,所述存储器存储有知识库A,A=(A1,A2,…,An,…,AN),An为A包括的第n个子知识库,An的实体类型标签为Ln,n的取值范围为1到N,N为A包括的子知识库的数量;An=(An,1,An,2,…,An,m,…,An,M),An,m为An中第m个实体链接关系,m的取值范围为1到M,M为An包括的实体链接关系的数量;An,m=(en,m,idn,m),en,m为An,m对应的实体,idn,m为en,m对应的链接ID;An的构建方法包括:
S010,获取第一实体e’的别名实体(e’1,e’2,…,e’t,…,e’T),e’t为e’的第t个别名实体,t的取值范围为1到T,T为e’的别名实体的数量;
S020,如果e’的实体类型为Ln对应的实体类型,且An中不存在实体与e’匹配,则将e’对应的实体链接关系存储在An中,并进入S030;如果e’的实体类型为Ln对应的实体类型,且An中存在实体与e’匹配,则不更新An,并进入S030;
S030,遍历(e’1,e’2,…,e’t,…,e’T),如果An中不存在实体与e’t匹配,则将e’t对应的实体链接关系存储在An,所述e’t对应的链接ID等于e’对应的链接ID;否则,不更新An;
所述系统还包括处理器和存储有计算机程序的存储介质,当所述计算机程序被处理器执行时,实现以下步骤:
S100,对目标文本text=(c1,c2,…,cq,…,cQ)进行词性分析,获取cq的词性;cq为text中第q个词条,q的取值范围为1到Q,Q为text包括的词条数量;
S200,如果cq的词性是名词,则获取cq的实体类型
S300,将
S400,如果(en,1,en,2,…,en,m,…,en,M)中en,m与cq匹配,则将idn,m作为cq的链接ID。
2.根据权利要求1所述的基于知识库的实体链接系统,其特征在于,S300中,利用AC自动机将cq与(en,1,en,2,…,en,m,…,en,M)进行匹配。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科雨辰科技有限公司,未经中科雨辰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310295026.2/1.html,转载请声明来源钻瓜专利网。