[发明专利]目标人物间亲密度识别方法、装置、电子设备及存储介质有效
申请号: | 201911056228.1 | 申请日: | 2019-10-31 |
公开(公告)号: | CN110825847B | 公开(公告)日: | 2022-09-02 |
发明(设计)人: | 陈鹏礼;尚高峰;杜国强 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/335;G06F40/279 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 李欣;丁芸 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 人物 亲密 识别 方法 装置 电子设备 存储 介质 | ||
本发明实施例提供了一种目标人物间亲密度识别方法、装置、电子设备及存储介质,通过获取语料库,利用预设的热词提取方法,从语料库中提取各热词,并获取各热词的亲密度标注信息,针对语料库中多个待分析文本数据的各条句子,若识别出该条句子中包括至少两个目标人物的名称,则将该条句子添加至候选语料集,针对候选语料集中的各条句子,根据该条句子中各热词的亲密度标注信息,确定该条句子对应的至少两个目标人物的亲密度关系,针对一组指定的至少两个目标人物,根据候选语料集中各条句子分别对应的指定的至少两个目标人物的亲密度关系,确定指定的至少两个目标人物间的亲密度。通过本方案,提高了识别目标任务之间亲密度的效率。
技术领域
本发明涉及计算机技术领域,特别是涉及一种目标人物间亲密度识别方法、装置、电子设备及存储介质。
背景技术
随着互联网的不断发展,互联网中的文本数据也迅速增长,互联网用户需要花费大量的时间从中搜索出符合自己阅读需求的文本内容。
当前的互联网技术中,可以基于互联网用户的阅读需求,向互联网用户推荐感兴趣的文本内容,例如,如果互联网用户对人物A感兴趣,则会将与人物A相关的所有文本内容都推荐给该互联网用户。
然而在实际应用时,当互联网用户阅读到某一个目标人物的时候,有可能会关注与该目标人物亲密的另一个目标人物的信息,因此,如何高效地识别不同的目标人物间的亲密度,为文本内容推荐提供推荐依据,成为亟待解决的技术问题。
发明内容
本发明实施例的目的在于提供一种目标人物间亲密度识别方法、装置、电子设备及存储介质,以提高识别目标人物之间的亲密度的效率。具体技术方案如下:
第一方面,本发明实施例提供了一种目标人物间亲密度识别方法,该方法包括:
获取语料库,其中,语料库包括多个待分析文本数据;
利用预设的热词提取方法,从语料库中提取各热词,并获取各热词的亲密度标注信息;
针对多个待分析文本数据中的各条句子,若识别出该条句子中包括至少两个目标人物的名称,则将该条句子添加至候选语料集;
针对候选语料集中的各条句子,根据该条句子中各热词的亲密度标注信息,确定该条句子对应的至少两个目标人物的亲密度关系;
针对一组指定的至少两个目标人物,根据候选语料集中各条句子对应的指定的至少两个目标人物的亲密度关系,确定指定的至少两个目标人物间的亲密度。
可选的,在针对多个待分析文本数据中的各条句子,若识别出该条句子中包括至少两个目标人物的名称,则将该条句子添加至候选语料集的步骤之前,该方法还包括:
分别将多个待分析文本数据中的各文本数据分割成多条句子,并对分割后的各条句子分别进行分词处理,得到分割后的各条句子中的分词数据;
针对多个待分析文本数据中的各条句子,识别该条句子中是否包括至少两个目标人物的名称的方式,包括:
针对分割后的各条句子,判断该条句子中的分词数据是否包括至少两个目标人物的名称。
可选的,在针对多个待分析文本数据中的各条句子,识别出该条句子中包括至少两个目标人物的名称的步骤之后,该方法还包括:
查询预先建立的目标人物关系表,判断至少两个目标人物间是否存在关系;
将该条句子添加至候选语料集的步骤,包括:
若识别出该条句子中包括至少两个目标人物的名称,且至少两个目标人物间存在关系,则将该条句子添加至候选语料集。
可选的,在利用预设的热词提取方法,从语料库中提取各热词,并获取各热词的亲密度标注信息的步骤之后,该方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911056228.1/2.html,转载请声明来源钻瓜专利网。