[发明专利]实体分类方法以及相关装置在审
申请号: | 202010246849.2 | 申请日: | 2020-03-31 |
公开(公告)号: | CN111460826A | 公开(公告)日: | 2020-07-28 |
发明(设计)人: | 李直旭;陈志刚;何莹;牛雷 | 申请(专利权)人: | 科大讯飞(苏州)科技有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F16/35;G06F16/36 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 黎坚怡 |
地址: | 215000 江苏省苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实体 分类 方法 以及 相关 装置 | ||
本申请公开了一种实体分类方法以及相关装置,其中,实体分类方法包括:获取待识别实体的至少一组待处理三元组;基于对样本实体的样本三元组进行训练得到的表达信息,获取待处理三元组的谓词表达和客体表达,以及预先设置的至少一个目标实体类别的类别表达,其中,待处理三元组和样本三元组均包含实体、谓词和客体;利用待处理三元组的谓词表达和客体表达,确定待识别实体的实体表达;基于待识别实体的实体表达分别与各个目标实体类别的类别表达之间的差异,确定待识别实体所属的实体类别。上述方案,能够提高实体分类的准确性。
技术领域
本申请涉及知识图谱领域,特别是涉及一种实体分类方法以及相关装置。
背景技术
随着人工智能的不断发展和突破,知识图谱(Knowledge Graph)作为未来强人工智能实现的技术基石,受到了广泛关注。知识图谱将实体非结构化的信息以结构化的三元组形式进行存储。三元组通常包含了实体的关系和属性信息。除此之外,实体类别在知识图谱中也是不可或缺的。
目前,在进行实体分类时往往严重依赖于实体所包含的可用于分类的信息,或者与其他实体之间的关系。然而,当实体所包含的可用于分类的信息过少,或者与其他实体之间的关系较少、甚至不存在时,将严重影响实体分类的准确性。有鉴于此,如何提高实体分类的准确性成为亟待解决的问题。
发明内容
本申请主要解决的技术问题是提供一种实体分类方法以及相关装置,能够确提高实体分类的准确性。
为了解决上述问题,本申请第一方面提供了一种实体分类方法,包括:获取待识别实体的至少一组待处理三元组;基于对样本实体的样本三元组进行训练得到的表达信息,获取待处理三元组的谓词表达和客体表达,以及预先设置的至少一个目标实体类别的类别表达,其中,待处理三元组和样本三元组均包含实体、谓词和客体;利用待处理三元组的谓词表达和客体表达,确定待识别实体的实体表达;基于待识别实体的实体表达分别与各个目标实体类别的类别表达之间的差异,确定待识别实体所属的实体类别。
为了解决上述问题,本申请第二方面提供了一种实体分类装置,包括相互耦接的存储器和处理器,存储器中存储有程序指令,处理器用于执行程序指令以实现上述第一方面中的实体分类方法。
为了解决上述问题,本申请第三方面提供了一种存储装置,存储有能够被处理器运行的程序指令,程序指令用于实现上述第一方面中的实体分类方法。
上述方案,获取待识别实体的至少一组待处理三元组,并基于对样本实体的样本三元组进行训练得到的表达信息,获取待处理三元组的谓词表达和客体表达,以及预先设置的至少一个目标实体类别的类别表达,且待处理三元组和样本三元组均包含实体、谓词和客体,进而利用待处理三元组的谓词表达和客体表达,确定待识别实体的实体表达,并基于待识别实体的实体表达分别与各个目标实体类别的类别表达之间的差异,确定待识别客体所属的实体类别,即无需依赖于实体所包含的可用于分类的信息,或者与其他实体之间的关系,只需待识别实体自身的待处理三元组即可确定待识别客体的实体类别,故能够提高实体分类的准确性。
附图说明
图1是本申请实体分类方法一实施例的流程示意图;
图2是利用若干样本实体构建实体类别树一实施例的流程示意图;
图3是实体类别树一实施例的框架示意图;
图4是利用样本实体的样本三元组训练得到表达信息一实施例的流程示意图;
图5是本申请实体分类方法另一实施例的流程示意图;
图6是本申请实体分类装置一实施例的框架示意图;
图7是本申请存储装置一实施例的框架示意图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞(苏州)科技有限公司,未经科大讯飞(苏州)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010246849.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种车牌的识别方法及装置
- 下一篇:用于更新事件集合的方法和装置