[发明专利]实体链接方法、装置、设备及存储介质有效
申请号: | 202010298036.8 | 申请日: | 2020-04-16 |
公开(公告)号: | CN111522911B | 公开(公告)日: | 2023-04-14 |
发明(设计)人: | 张发恩;姜勇越 | 申请(专利权)人: | 创新奇智(青岛)科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/36 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 李飞 |
地址: | 266200 山东省青岛市*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实体 链接 方法 装置 设备 存储 介质 | ||
本申请公开一种实体链接方法、装置、设备及存储介质,其中,实体链接方法包括步骤:提取待入库实体的文本信息,其中,所述文本信息包括待入库实体的作者名称,所述待入库实体表征待入库论文;至少根据所待入库实体的作者名称在科研工作者实体库中检索与所述待入库实体的作者名称相匹配的实体并得到候选实体的文本信息;将候选实体的文本信息与所述待入库实体的文本信息进行比较并确定比较结果;当所述比较结果表征所述待入库实体与所候选实体为同一作者时,将所述待入库实体与所述候选实体链接。本申请能够实现待入库实体与是实体库中的实体连接。
技术领域
本申请涉及计算技术领域,尤其涉及一种实体链接方法、装置、设备及存储介质。
背景技术
随着大量论文的涌现,科研工作者希望论文管理平台在提供论文下载的同时,可以提供更多的服务。
目前,国内的论文管理平台,如知网、万方和维普等,可根据科研工作者感兴趣的领域提供论文的查阅、推荐和下载,但是大部分论文管理平台并没有针对论文的作者进行实体链接,即没有从论文中提取出的科研工作者是不是现实生活当中的那位有相同名字的科研工作者,而是选择用认领的方式来让现实当中作者本人自己取判断是否是自己的论文,这种处理不利于进行深度分析,如同门和师生等人际关系的挖掘。
发明内容
本申请目的在于公开一种实体链接方法、装置、设备及存储介质,用于实现实体链接,以便于对作为实体的论文进行深度分析。
本申请第一方面公开一种实体链接方法,所述方法包括:
提取待入库实体的文本信息,其中,所述文本信息包括待入库实体的作者名称,所述待入库实体表征待入库论文;
至少根据所待入库实体的作者名称在科研工作者实体库中检索与所述待入库实体的作者名称相匹配的实体并得到候选实体的文本信息;
将候选实体的文本信息与所述待入库实体的文本信息进行比较并确定比较结果;
当所述比较结果表征所述待入库实体与所候选实体为同一作者时,将所述待入库实体与所述候选实体链接。
在本申请第一方面中,通过所待入库实体的作者名称在科研工作者实体库中检索与待入库实体的作者名称相匹配的实体并得到候选实体的文本信息,进而能够根据将候选实体的文本信息与待入库实体的文本信息进行比较并确定比较结果,从而能够根据比较结果将待入库实体与候选实体实体链接。
作为一种可选的实施方式,在所述提取待入库实体的文本信息之后,所述至少根据所待入库实体的作者名称在科研工作者实体库中检索与所述待入库实体的作者名称相匹配的实体并得到候选实体的文本信息之前,所述方法还包括:
根据所述待入库实体的作者名称得到所述待入库实体的名称扩展集合;
以及,至少根据所待入库实体的作者名称在科研工作者实体库中检索与所述待入库实体的作者名称相匹配的实体并得到候选实体的文本信息,包括:
根据所待入库实体的作者名称、名称扩展集合在所述在科研工作者实体库中检索与所述待入库实体的作者名称相匹配的实体并得到候选实体的文本信息。
在本可选的实施方式中,能够根据待入库实体的作者名称得到待入库实体的名称扩展集合,进而能够根据所待入库实体的作者名称、名称扩展集合在在科研工作者实体库中检索与待入库实体的作者名称相匹配的实体并得到候选实体的文本信息。
作为一种可选的实施方式,所述将候选实体的文本信息与所述待入库实体的文本信息进行比较并确定比较结果,包括:
当所述候选实体的文本信息与所述待入库实体的文本信息存在交集时,则确定所述比较结果为所述候选实体与所述待入库实体为同一作者。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新奇智(青岛)科技有限公司,未经创新奇智(青岛)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010298036.8/2.html,转载请声明来源钻瓜专利网。