[发明专利]实体链接方法、装置、设备及存储介质有效
申请号: | 202010298036.8 | 申请日: | 2020-04-16 |
公开(公告)号: | CN111522911B | 公开(公告)日: | 2023-04-14 |
发明(设计)人: | 张发恩;姜勇越 | 申请(专利权)人: | 创新奇智(青岛)科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/36 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 李飞 |
地址: | 266200 山东省青岛市*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实体 链接 方法 装置 设备 存储 介质 | ||
1.一种实体链接方法,其特征在于,所述方法包括:
提取待入库实体的文本信息,其中,所述文本信息包括待入库实体的作者名称,所述待入库实体表征待入库论文;
至少根据所待入库实体的作者名称在科研工作者实体库中检索与所述待入库实体的作者名称相匹配的实体并得到候选实体的文本信息;
将候选实体的文本信息与所述待入库实体的文本信息进行比较并确定比较结果;
当所述比较结果表征所述待入库实体与所候选实体为同一作者时,将所述待入库实体与所述候选实体链接;
以及,所述将候选实体的文本信息与所述待入库实体的文本信息进行比较并确定比较结果,包括:
当所述候选实体的文本信息与所述待入库实体的文本信息不存在交集时,计算所述候选实体与所述待入库实体的链接得分;
根据所述候选实体与所述待入库实体的链接得分确定所述比较结果;
以及,根据以下公式计算所述候选实体与所述待入库实体的链接得分:
Score=ω0U+ω1L+ω2T+D;
其中,Sore表征所述链接得分,U表征所述待入库实体与所述候选实体之间的单位得分,L表征所述待入库实体与所述候选实体之间的研究领域得分,T表征所述待入库实体与所述候选实体之间合著关系得分,ωi,i=0,1,2表征所述单位得分的加权系数、所述研究领域得分的加权系数、所述合著关系得分的加权系数,D表征修正系数。
2.如权利要求1所述的方法,其特征在于,在所述提取待入库实体的文本信息之后,所述至少根据所待入库实体的作者名称在科研工作者实体库中检索与所述待入库实体的作者名称相匹配的实体并得到候选实体的文本信息之前,所述方法还包括:
根据所述待入库实体的作者名称得到所述待入库实体的名称扩展集合;
以及,至少根据所待入库实体的作者名称在科研工作者实体库中检索与所述待入库实体的作者名称相匹配的实体并得到候选实体的文本信息:包括:
根据所待入库实体的作者名称、名称扩展集合在所述在科研工作者实体库中检索与所述待入库实体的作者名称相匹配的实体并得到候选实体的文本信息。
3.如权利要求1所述的方法,其特征在于,所述将候选实体的文本信息与所述待入库实体的文本信息进行比较并确定比较结果,包括:
当所述候选实体的文本信息与所述待入库实体的文本信息存在交集时,则确定所述比较结果为所述候选实体与所述待入库实体为同一作者。
4.如权利要求1的方法,其特征在于,所述根据所述候选实体与所述待入库实体的链接得分确定所述比较结果,包括:
将所述链接得分与第一预设阈值比对;
当所述链接得分大于或等于所述第一预设阈值,确定所述比较结果为所述候选实体与所述待入库实体为同一作者。
5.如权利要求4所述的方法,其特征在于,所述根据所述候选实体与所述待入库实体的链接得分确定所述比较结果,还包括:
当所述链接得分小于所述第一预设阈值,则判断所述待入库实体是否是学位论文,若是,则根据所述待入库实体与所述候选实体的单位得分、研究领域得分、合著关系得分、导师项得分和学位得分重新计算链接得分;
将重新计算的所述链接得分与第二预设阈值比对,若重新计算的所述链接得分大于等于所述第二预设阈值,则确定所述比较结果为所述候选实体与所述待入库实体为同一作者。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新奇智(青岛)科技有限公司,未经创新奇智(青岛)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010298036.8/1.html,转载请声明来源钻瓜专利网。