[发明专利]一种复杂版面图文识别学科类知识图谱嵌入学习方法在审

专利信息
申请号: 202111215955.5 申请日: 2021-10-19
公开(公告)号: CN115995085A 公开(公告)日: 2023-04-21
发明(设计)人: 余海涛;沙龙;洪鹏宇 申请(专利权)人: 蓝舰信息科技南京有限公司
主分类号: G06V30/41 分类号: G06V30/41;G06V10/94;G06V10/764;G06V10/82;G06F16/55;G06F16/583;G06F16/36
代理公司: 天津垠坤知识产权代理有限公司 12248 代理人: 王忠玮;赵玉琴
地址: 210000 江苏省南京市*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 复杂 版面 图文 识别 学科 知识 图谱 嵌入 学习方法
【说明书】:

发明公开了一种复杂版面图文识别学科类知识图谱嵌入学习方法,属于人工智能技术领域,包括以下步骤:S1、构建知识图谱嵌入学习模型,创建图谱单元并通过三元组存储;S2、整理知识图谱数据流整理成为大规模三元组;S3、对关系r之间存在的超关系对应的进行算法设计,并对算法学习的参数进行统计;S4、进行模型学习和训练,并对训练之后的模型进行验证;S5、知识图谱嵌入学习模型进行神经网络训练,在模型收敛后对过拟合进行验证,该复杂版面图文识别学科类知识图谱嵌入方法,提升了图嵌入算法的表征学习质量,解决了独热编码和随机游走等方法本身造成的内在限制,使得图嵌入对于各类的图元素之间的关系类型可以有效的差异化学习。

技术领域

本发明属于人工智能技术领域,具体涉及复杂版面图文识别学科类知识图谱嵌入方法。

背景技术

现有教育复杂版面图文识别知识图谱在构建后需要进行有效的图嵌入学习来完成初步表征学习(representation learning),更好的表征学习可以有效提升下游算法例如推荐算法,分类算法的表现。通常初步图嵌入学习使用独热编码(one-hotrepresentation)或随机游走算法,由于算法本身的限制,没有考虑到对于不同关系r之间可能存在的反演对称性,组合对称性等性质,表征学习会造成信息瓶颈效应,使得下游算法表现不佳;

因此,需要研发一种新的知识图谱嵌入方法来解决现有的问题。

发明内容

本发明的目的在于提供一种复杂版面图文识别学科类知识图谱嵌入方法,以解决表征学习造成信息瓶颈效应,使得下游算法表现不佳的问题。

为实现上述目的,本发明提供如下技术方案:一种复杂版面图文识别学科类知识图谱嵌入学习方法,包括以下步骤:

S1、构建知识图谱嵌入学习模型,创建图谱单元并通过三元组存储;所述图谱单元包括:知识点kp和关系r;

S2、整理知识图谱数据流整理成为大规模三元组,整合后的知识图谱嵌入学习模型包括复杂的层级和相互关联的关系;

S3、对关系r之间存在的超关系对应的进行算法设计,并对算法学习的参数进行统计;

S4、通过GPU硬件对知识图谱嵌入学习模型进行模型学习和训练,并对训练之后的模型进行验证;

S5、知识图谱嵌入学习模型进行神经网络训练,在模型收敛后对过拟合进行验证,如果验证通过则图谱嵌入学习完成,同时对下游接口设定嵌入表征存取接口需求,并发和功耗需求,完成下游接口开发。

优选的,所述步骤S1中,并通过神经网络对知识点kp和关系r进行分别表征,所述知识点kp包括头知识点kp1、尾知识点kp2,其中,关系r定义为从头知识点到尾知识点的运算参数。

优选的,所述步骤S3中,使用三维特殊正交群对知识点kp和关系r进行参数化和运算,所述统计包括总体知识点数量、关系类型数量、嵌入维度参数。

优选的,所述知识点kp使用n个三维坐标参数(xi,yi,zi);关系r使用欧拉角参数(φi,θi,ψi),n是超参数,所述知识点kp和关系r的运算转化为通过群运算约束的向量运算。

优选的,所述向量运算,使关系r满足对角矩阵运算,其中Mi是3x3的块矩阵:

优选的,所述步骤S5中,所述下游接口包括向量读写接口、支持高并发批量读取和对于低功耗需求端设备运行的压缩支持接口。

优选的,所述关系r为导数的应用和极值。

优选的,所述关系r为知识点kp在知识树不同节点之间的相互关联关系,包括二次函数的性质和三次函数的性质。

优选的,所述步骤S4中,所述验证包括但不限于三元组补全验证、下游分类模型验证。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于蓝舰信息科技南京有限公司,未经蓝舰信息科技南京有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111215955.5/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top