[发明专利]人物共现关系确定方法、专家推荐方法、装置及设备有效
申请号: | 201711477743.8 | 申请日: | 2017-12-29 |
公开(公告)号: | CN108287875B | 公开(公告)日: | 2021-10-26 |
发明(设计)人: | 蔡巍;崔朝辉;赵立军;张霞 | 申请(专利权)人: | 东软集团股份有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/9536 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 刘晓菲;王宝筠 |
地址: | 110179 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 人物 关系 确定 方法 专家 推荐 装置 设备 | ||
本申请实施例公开了一种人物共现关系确定方法、专家推荐方法、装置及设备,提高了人物共现关系确定准确率以及实现了为用户推荐专家的目的。其中,人物共现关系确定方法包括:获取第一人物的第一文本集合和第二人物的第二文本集合;从所述第一文本集合中抽取所述第一人物参与的事件,形成第一事件集合;从所述第二文本集合中抽取所述第二人物参与的事件,形成第二事件集合;从所述第一事件集合和所述第二事件集合中确定相同事件;基于所述相同事件构建所述第一人物和所述第二人物的共现关系。
技术领域
本申请涉及大数据领域,尤其涉及一种人物共现关系确定方法、专家推荐方法、装置及设备。
背景技术
人物的共现关系是指两个或多个人物由于共同出现而建立的关系。人物的共现关系可以反映人物的社会合作或交往关系,是非常重要的信息。
现有技术中人物共现关系根据两个或多个人物在文本中同时出现的频次来进行确定,但是同时出现的频次高并不一定能反映出人物之间是具有关系的,比如说,有多家新闻媒体在同一天报道了两个事件,这两个事件分别和一个人物相关,且这两个事件毫无关系,那么虽然这两个人物同时出现在这些新闻媒体在该天的新闻报道中,在文本中同时出现的频次较高,但是二者之间没有任何关系。可见,基于在文本中同时出现的频次来确定人物共现关系的方法准确性较低。
发明内容
为了解决现有技术中存在的技术问题,本申请提供了一种人物共现关系确定方法、专家推荐方法、装置及设备,实现提高人物共现关系确定准确性以及为用户推荐专家的目的。
本申请实施例提供了一种人物共现关系确定方法,所述方法包括:
获取第一人物的第一文本集合和第二人物的第二文本集合;
从所述第一文本集合中抽取所述第一人物参与的事件,形成第一事件集合;
从所述第二文本集合中抽取所述第二人物参与的事件,形成第二事件集合;
从所述第一事件集合和所述第二事件集合中确定相同事件;
基于所述相同事件构建所述第一人物和所述第二人物的共现关系。
可选的,所述基于所述相同事件确定所述第一人物和所述第二人物的共现关系包括:
从所述第一文本集合中确定包含所述相同事件的文本,形成第三文本集合;
获取所述第三文本集合中各个文本的关键词,形成第一关键词集合;
从所述第二文本集合中确定包含所述相同事件的文本,形成第四文本集合;
获取所述第四文本集合中各个文本的关键词,形成第二关键词集合;
若所述第一关键词集合和第二关键词集合之间的相似性大于预设阈值,则构建所述第一人物和所述第二人物之间的共现关系。
可选的,所述第三文本集合和/或所述第四文本集合包括第一文本,根据如下方法得到所述第一文本的关键词:
对所述第一文本进行分词,得到第一特征词;
根据所述第一特征词在所述第一文本中出现的频次,以及其他特征词与所述第一特征词出现在同一个句子中的次数,得到所述第一特征词是否属于所述第一文本的关键词的判断结果。
可选的,所述从所述第一事件集合和所述第二事件集合中确定相同事件包括:
从所述第一事件集合和所述第二事件集合中确定事件内容相同,且事件发生时间和事件发生地点至少其中一个相同的事件。
本申请实施例还提供了一种专家推荐方法,所述方法包括:
获取待进行专家推荐的目标研究方向;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东软集团股份有限公司,未经东软集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711477743.8/2.html,转载请声明来源钻瓜专利网。