[发明专利]多模态知识图谱构建方法、装置、服务器以及存储介质在审
申请号: | 201910778329.3 | 申请日: | 2019-08-22 |
公开(公告)号: | CN110472107A | 公开(公告)日: | 2019-11-19 |
发明(设计)人: | 江小琴;刘文强;程序;谢思发;张涵宇 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/901 | 分类号: | G06F16/901;G06F16/28;G06F16/36 |
代理公司: | 44285 深圳市深佳知识产权代理事务所(普通合伙) | 代理人: | 骆苏华<国际申请>=<国际公布>=<进入 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 构建 多模态 游戏领域 图谱 图谱构建 非结构化数据 结构化数据 服务集合 拓扑模块 粗粒度 工具集 拓扑图 流式 存储介质 快速构建 流式处理 模块获取 预设周期 精细化 校正 服务器 应用 图片 | ||
1.一种多模态知识图谱构建方法,其特征在于,应用于多模态知识图谱构建系统的构建层,所述构建层包括流式构建拓扑模块、微服务集合模块以及工具集模块,所述方法包括:
所述流式构建拓扑模块获取游戏领域的结构化数据,并对所述游戏领域的结构化数据进行在线流式处理,生成图谱构建拓扑图;
所述微服务集合模块获取游戏领域的非结构化数据,并对所述游戏领域的非结构化数据进行处理,以在所述图片构建拓扑图的基础上构建粗粒度的多模态知识图谱;
所述工具集模块按照预设周期对所述粗粒度的多模态知识图谱进行校正,以构建精细化的多模态知识图谱。
2.根据权利要求1所述的方法,其特征在于,所述流式构建拓扑模块获取游戏领域的结构化数据,包括:
所述流式构建拓扑模块订阅卡夫卡消息总线中的属性值订阅号,获取游戏领域的结构化数据,所述游戏领域的结构化数据包括所述属性值订阅号中的属性值。
3.根据权利要求2所述的方法,其特征在于,所述微服务集合模块获取游戏领域的非结构化数据,包括:
所述微服务集合模块订阅所述卡夫卡消息总线中的新闻文本订阅号、评论文本订阅号、图片及视频链接订阅号获取游戏领域的非结构化数据,所述游戏领域的非结构化数据包括所述新闻文本订阅号中的新闻文本数据、所述评论文本订阅号中的评论文本数据、所述图片及视频链接订阅号中的图片、音频及视频文件。
4.根据权利要求1或2所述的方法,其特征在于,所述流式构建拓扑模块对所述游戏领域的结构化数据进行在线流式处理,生成图谱构建拓扑图,包括:
所述流式构建拓扑模块对所述游戏领域的结构化数据进行数据清洗、知识融合及图谱数据落地处理,生成构建多模态知识图谱所需的知识;其中,所述流式构建拓扑模块对所述游戏领域的结构化数据进行知识融合处理,包括:所述流式构建拓扑模块对所述游戏领域的结构化数据进行实体链接处理以及属性融合;
将所述构建多模态知识图谱所需的知识录入图数据库,生成所述图谱构建拓扑图。
5.根据权利要求1所述的方法,其特征在于,所述微服务集合模块中包含多个微服务,所述微服务集合模块对所述游戏领域的非结构化数据进行处理,包括:
通过所述微服务集合模块中的知识抽取微服务对新闻文本订阅号中的新闻文本数据进行知识抽取处理;
通过所述微服务集合模块中的游戏语料提取微服务对新闻文本订阅号中的新闻文本数据进行游戏语料抽取处理;
通过所述微服务集合模块中的事件提取微服务对新闻文本订阅号中的新闻文本数据进行事件抽取处理;
通过所述微服务集合模块中的观点及情感词提取微服务对评论文本订阅号中的评论文本数据进行观点及情感词提取处理;
通过所述微服务集合模块中的文件下载微服务对图片及视频链接订阅号中的图片、视频及音频文件进行处理。
6.根据权利要求1所述的方法,其特征在于,所述工具集模块按照预设周期对所述粗粒度的多模态知识图谱进行校正,包括:
所述工具集模块按照预设周期通过图谱扫描修正工具和知识消岐工具对所述粗粒度的多模态知识图谱进行校正。
7.根据权利要求4所述的方法,其特征在于,所述流式构建拓扑模块对所述游戏领域的结构化数据进行实体链接处理以及属性融合,包括:
所述流式构建拓扑模块通过实体名对所述游戏领域的结构化数据处理后提取出词干生成实体名同义词库将不同实体进行链接;
所述流式构建拓扑模块按照所述游戏领域的结构化数据的数据源的可信度排序,选取排序靠前的预设数量的结构化数据作为实体属性的值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910778329.3/1.html,转载请声明来源钻瓜专利网。