[发明专利]基于知识图谱的对象识别方法、装置、可读介质和设备在审
申请号: | 202110892035.0 | 申请日: | 2021-08-04 |
公开(公告)号: | CN113486989A | 公开(公告)日: | 2021-10-08 |
发明(设计)人: | 刘江冬;钟黎;易坤 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/36;G06N3/04;G06N3/06;G06N3/08 |
代理公司: | 北京英创嘉友知识产权代理事务所(普通合伙) 11447 | 代理人: | 魏云鹿 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 知识 图谱 对象 识别 方法 装置 可读 介质 设备 | ||
1.一种基于知识图谱的对象识别方法,其特征在于,所述方法包括:
根据预先建立的游戏知识图谱,确定用于表征目标游戏的目标游戏向量,和用于表征待识别对象的待识别对象向量;
根据所述待识别对象向量、所述目标游戏向量和预先训练的识别模型,确定所述待识别对象与所述目标游戏的相关度,所述识别模型为根据用于表征所述目标游戏种子对象的种子对象向量和所述目标游戏向量训练得到的,所述种子对象向量根据所述游戏知识图谱确定;
若所述待识别对象与所述目标游戏的相关度满足预设条件,确定所述待识别对象为所述目标游戏的目标对象。
2.根据权利要求1所述的方法,其特征在于,所述根据所述待识别对象向量、所述目标游戏向量和预先训练的识别模型,确定所述待识别对象与所述目标游戏的相关度,包括:
将所述待识别对象向量、所述目标游戏向量和所述待识别对象的对象特征,输入所述识别模型,以得到所述识别模型输出的所述待识别对象与所述目标游戏的相关度,所述对象特征根据所述待识别对象的对象信息确定。
3.根据权利要求1或2所述的方法,其特征在于,所述游戏知识图谱包括多个节点和至少一个边,所述多个节点包括:对象节点、游戏节点和内容节点;每个边用于表征该边两端的两个节点之间具有关联。
4.根据权利要求3所述的方法,其特征在于,所述对象节点包括多个样本对象对应的对象节点,所述样本对象包括正样本对象和负样本对象,所述正样本对象包括所述种子对象;
所述方法还包括:针对所述目标游戏训练所述识别模型;
所述针对所述目标游戏训练所述识别模型,包括:
获取样本输入集,所述样本输入集包括:每个所述样本对象对应的样本输入,所述样本输入包括:根据所述游戏知识图谱确定的,用于表征该样本对象的对象向量和所述目标游戏向量;
获取样本输出集,所述样本输出集中包括与每个所述样本输入对应的样本输出,每个所述样本输出包括对应的所述样本对象的真实识别结果;
将所述样本输入集作为所述识别模型的输入,将所述样本输出集作为所述识别模型的输出,以训练所述识别模型。
5.根据权利要求4所述的方法,其特征在于,所述正样本对象还包括扩展对象,所述扩展对象是通过以下方式确定的:
根据用于表征其他游戏的其他游戏向量与所述目标游戏向量,确定所述其他游戏与所述目标游戏的相关度,所述其他游戏为除所述目标游戏之外的游戏,所述其他游戏向量根据所述游戏知识图谱确定;
将与所述目标游戏的相关度大于或等于预设的相关度阈值的所述其他游戏,作为所述目标游戏对应的相关游戏;
将所述相关游戏的活跃对象作为所述扩展对象。
6.根据权利要求4所述的方法,其特征在于,所述将所述样本输入集作为所述识别模型的输入,将所述样本输出集作为所述识别模型的输出,以训练所述识别模型,包括:
按照预设的聚类算法对所述样本输入集进行聚类,以得到多组样本输入子集,每组所述样本输入子集对应一组样本输出子集;
针对每组所述样本输入子集,将该组样本输入子集输入所述识别模型中包括的,该组样本输入子集对应的识别子模型,并将该组样本输入子集对应的样本输出子集,作为该组样本输入子集对应的识别子模型的输出,以训练该组样本输入子集对应的识别子模型;
所述识别模型的输出,根据每组所述样本输入子集对应的识别子模型的输出确定。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110892035.0/1.html,转载请声明来源钻瓜专利网。