[发明专利]针对作者消歧的信息处理装置、方法和介质在审
申请号: | 201910384663.0 | 申请日: | 2019-05-09 |
公开(公告)号: | CN111914092A | 公开(公告)日: | 2020-11-10 |
发明(设计)人: | 夏迎炬;郑仲光;孟遥;陈炎 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06F16/36 | 分类号: | G06F16/36 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 唐京桥;刘烨 |
地址: | 日本神*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 针对 作者 信息处理 装置 方法 介质 | ||
公开了一种针对作者消歧的信息处理装置、方法和介质。所述装置包括:图谱构建单元,其配置成基于从文献库中提取的实体及其属性来构建知识图谱,所述实体包括作者实体及其相关联的实体;遍历单元,其配置成遍历所构建的知识图谱,以获得有关作者的节点序列;对齐单元,其配置成针对所述节点序列,基于所述属性进行节点对齐;以及计算单元,其配置成计算对齐的节点序列之间的相似度,其中,根据所计算的相似度进行所述作者消歧。
技术领域
本公开涉及信息处理的技术领域,具体地涉及针对作者消歧的信息处理装置和方法。
背景技术
这个部分提供了与本公开有关的背景信息,这不一定是现有技术。
对于基于文献计量数据以及研究评估目的的大部分研究,必须能够将特定的书目记录归于个体研究人员。一个实际的问题是在这个过程中存在一定程度的模糊性,这被称为作者消歧。该问题以两种方式表现出来:给定的个体可以被识别为两个或更多个作者,或者两个或更多个个体可以被识别为单个作者。考虑到在大多数学科中活跃的大量研究人员,作者姓名并不能明显区分开来是作者消歧问题产生的根本原因。
发明内容
这个部分提供了本公开的一般概要,而不是其全部范围或其全部特征的全面披露。
本公开的目的在于提供一种采用知识图相似度进行作者消歧的技术方案。其中,使用从知识图提取的节点序列来计算相似度。本公开通过使用不同节点之间的关系提供了更有效的作者消歧的方法。
根据本公开的一方面,提供了一种针对作者消歧的信息处理装置,包括:图谱构建单元,其配置成基于从文献库中提取的实体及其属性来构建知识图谱,所述实体包括作者实体及其相关联的实体;遍历单元,其配置成遍历所构建的知识图谱,以获得有关作者的节点序列;对齐单元,其配置成针对所述节点序列,基于所述属性进行节点对齐;以及计算单元,其配置成计算对齐的节点序列之间的相似度,其中,根据所计算的相似度进行所述作者消歧。
根据本公开的另一方面,提供了一种针对作者消歧的信息处理方法,包括:基于从文献库中提取的实体及其属性来构建知识图谱,所述实体包括作者实体及其相关联的实体;遍历所构建的知识图谱,以获得有关作者的节点序列;针对所述节点序列,基于所述属性进行节点对齐;以及计算对齐的节点序列之间的相似度,其中,根据所计算的相似度进行所述作者消歧。
根据本公开的另一方面,提供了一种程序产品,该程序产品包括存储在其中的机器可读指令代码,其中,所述指令代码当由计算机读取和执行时,能够使所述计算机执行根据本公开的针对作者消歧的信息处理方法。
根据本公开的另一方面,提供了一种机器可读存储介质,其上携带有根据本公开的程序产品。
从在此提供的描述中,进一步的适用性区域将会变得明显。这个概要中的描述和特定例子只是为了示意的目的,而不旨在限制本公开的范围。
附图说明
在此描述的附图只是为了所选实施例的示意的目的而非全部可能的实施,并且不旨在限制本公开的范围。在附图中:
图1为根据本公开的一个实施例的针对作者消歧的信息处理装置100的框图;
图2示例性示出根据本公开的一个实施例的知识图谱的一部分;
图3为根据本公开的一个实施例的针对作者消歧的信息处理方法的流程图;以及
图4为其中可以实现根据本公开的实施例的针对作者消歧的信息处理装置和方法的通用个人计算机的示例性结构的框图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910384663.0/2.html,转载请声明来源钻瓜专利网。