[发明专利]实体关系的获取方法、装置、计算机可读介质及电子设备有效
申请号: | 201810545940.7 | 申请日: | 2018-05-25 |
公开(公告)号: | CN110162768B | 公开(公告)日: | 2022-12-30 |
发明(设计)人: | 谭小龙;汤煌;张小鹏 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/289 |
代理公司: | 深圳市联鼎知识产权代理有限公司 44232 | 代理人: | 刘抗美 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实体 关系 获取 方法 装置 计算机 可读 介质 电子设备 | ||
1.一种实体关系的获取方法,其特征在于,包括:
根据第一语料库获取实体组合的第一频次、各候选关系词的第二频次及各候选实体关系组合的第三频次,其中各候选实体关系组合为所述实体组合分别与各候选关系词的组合,所述实体组合包括第一实体和第二实体;
根据所述第一语料库获取各候选实体关系组合中的各实体与候选关系词之间的距离信息,所述距离信息包括所述第一实体与所述候选关系词之间的第一距离以及所述第二实体与所述候选关系词之间的第二距离;
根据所述第一频次、各候选关系词的第二频次、各候选实体关系组合的第三频次、所述第一距离和所述第二距离,获取各候选实体关系组合的关联度,所述关联度与所述第三频次正相关,所述关联度与所述第一频次和所述第二频次负相关,所述关联度与所述第一距离或所述第二距离负相关;
根据各候选实体关系组合的关联度确定实体关系。
2.根据权利要求1所述的方法,其特征在于,其中各候选实体关系组合的关联度cor通过以下公式获取:
上述公式中,e1为所述第一实体,e2为所述第二实体,r为候选关系词,F(e1,e2)为所述实体组合的第一频次,F(r)为所述候选关系词的第二频次,F(e1,r,e2)为候选实体关系组合的第三频次,dis(e1,r)为所述第一实体与所述候选关系词之间的第一距离,dis(e2,r)为所述第二实体与所述候选关系词之间的第二距离。
3.根据权利要求2所述的方法,其特征在于,所述第一距离为所述第一实体与所述候选关系词之间的最小距离,所述第二距离为所述第二实体与所述候选关系词之间的最小距离。
4.根据权利要求1所述的方法,其特征在于,还包括:获取各候选实体关系组合的语义信息;
其中,所述获取各候选实体关系组合的关联度包括利用所述语义信息。
5.根据权利要求1所述的方法,其特征在于,还包括:
利用实体库和第二语料库获取所述实体组合;
利用关系词库和所述第二语料库获取各候选关系词。
6.根据权利要求5所述的方法,其特征在于,利用实体库和第二语料库获取所述实体组合,包括:
对于从所述第二语料库中获取的语料,将所述语料中的实体与所述实体库中的实体进行匹配,得到匹配实体;以及
将同一语料中的任两个或多个所述匹配实体组合构成所述实体组合;
其中,利用关系词库和所述第二语料库获取各候选关系词,包括:
将同一语料中的关系词与所述关系词库中的关系词进行匹配,得到候选关系词。
7.根据权利要求6所述的方法,其特征在于,将所述语料中的实体与所述实体库中的实体进行匹配,包括:
将所述实体库中的实体存入字典树;
将所述语料中的实体与所述字典树中的实体进行匹配。
8.根据权利要求6所述的方法,其特征在于,还包括:
获取所述实体组合中的实体之间的第三距离;
当所述第三距离大于距离阈值时,过滤相应的实体组合。
9.根据权利要求6所述的方法,其特征在于,还包括:当所述实体组合中的实体之间存在包含关系时,过滤相应的实体组合。
10.根据权利要求6所述的方法,其特征在于,还包括:当所述候选关系词之一与所述实体组合中的一个实体之间存在包含关系时,过滤所述候选关系词之一。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810545940.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:文本纠错的方法和装置
- 下一篇:文本主题输出方法和装置、存储介质及电子装置