[发明专利]游戏领域的知识图谱关系匹配方法、模型构建方法及装置有效
申请号: | 202010191888.7 | 申请日: | 2020-03-18 |
公开(公告)号: | CN111538843B | 公开(公告)日: | 2023-06-16 |
发明(设计)人: | 徐波 | 申请(专利权)人: | 广州多益网络股份有限公司;广东利为网络科技有限公司;多益网络有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/216 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 麦小婵;郝传鑫 |
地址: | 510000 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 游戏 领域 知识 图谱 关系 匹配 方法 模型 构建 装置 | ||
1.一种游戏领域的知识图谱关系匹配模型构建方法,其特征在于,包括:
获取开放领域的关系匹配数据集;
基于TFIDF文本相似度的方法,从所述开放领域的关系匹配数据集中获取适用于所述游戏领域的关系匹配数据集;
采集开放领域的自由文本,并对所述开放领域的自由文本进行预训练,构建语言模型;其中,所述语言模型为知识图谱关系匹配所需的模型结构;
根据所述游戏领域的关系匹配数据集,对所述语言模型进行增量训练,以构建所述游戏领域的知识图谱关系匹配模型;
所述基于TFIDF文本相似度的方法,从所述开放领域的关系匹配数据集中获取适用于所述游戏领域的关系匹配数据集,包括:
分别采集开放领域的自由文本集合和所述游戏领域的自由文本集合;
依次获取所述开放领域的关系匹配数据集中的关系匹配数据,作为待定关系匹配数据;
计算所述待定关系匹配数据中的问题在所述开放领域的自由文本集合中的TFIDF值,作为开放领域分布量;
计算所述待定关系匹配数据中的问题在所述游戏领域的自由文本集合中的TFIDF值,作为游戏领域分布量;
当所述待定关系匹配数据的开放领域分布量与游戏领域分布量的差值小于第一预设阈值时,将所述待定关系匹配数据作为目标关系匹配数据,并加入所述游戏领域的关系匹配数据集。
2.如权利要求1所述的游戏领域的知识图谱关系匹配模型构建方法,其特征在于,所述获取开放领域的关系匹配数据集,包括:
采集开放领域的知识图谱和问答数据集;其中,所述问答数据集中包括至少一个问答对;
将所述问答数据集中的问答对和所述知识图谱中的三元组进行对齐操作,为每一问答对匹配对应的目标三元组;
将所述问答对的问题与对应目标三元组的关系构造“问题-关系”的关系匹配数据,以形成所述开放领域的关系匹配数据集。
3.如权利要求2所述的游戏领域的知识图谱关系匹配模型构建方法,其特征在于,所述将所述问答数据集中的问答对和所述知识图谱中的三元组进行对齐操作,为每一问答对匹配对应的目标三元组,包括:
对所述开放领域的知识图谱中三元组的客体建立反向索引;
针对每一问答对,从所述开放领域的知识图谱中检索出客体为所述问答对的答案的备选三元组;
计算每一所述备选三元组中的主体与关系在所述问答对的问题中的相似度,并获取相似度最高的备选三元组作为所述问答对的目标三元组。
4.如权利要求3所述的游戏领域的知识图谱关系匹配模型构建方法,其特征在于,采用基于lcs字符匹配的相似度算法,计算每一所述备选三元组中的主体与关系在所述问答对的问题中的相似度。
5.如权利要求1所述的游戏领域的知识图谱关系匹配模型构建方法,其特征在于,所述当所述待定关系匹配数据的开放领域分布量与游戏领域分布量的差值小于第一预设阈值时,将所述待定关系匹配数据作为目标关系匹配数据,并加入所述游戏领域的关系匹配数据集之后,包括:
计算所述游戏领域的关系匹配数据集中每一目标关系匹配数据的关系与预设的游戏领域知识图谱中的关系的相似度;
根据相似度大于第二预设阈值的游戏领域知识图谱的关系,扩增与其对应的目标关系匹配数据,以扩增后的关系匹配数据集作为所述游戏领域的关系匹配数据集。
6.如权利要求1所述的游戏领域的知识图谱关系匹配模型构建方法,其特征在于,所述采集开放领域的自由文本,并对所述开放领域的自由文本进行预训练,构建语言模型,包括:
采集开放领域的自由文本,并采用transformer架构预训练得到第一语言模型;
在所述第一语言模型中增加双向LSTM层和attention层,并最后连接sigmoid函数,以形成所述语言模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州多益网络股份有限公司;广东利为网络科技有限公司;多益网络有限公司,未经广州多益网络股份有限公司;广东利为网络科技有限公司;多益网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010191888.7/1.html,转载请声明来源钻瓜专利网。