[发明专利]一种复杂版面图文识别学科类知识图谱嵌入学习方法在审
申请号: | 202111215955.5 | 申请日: | 2021-10-19 |
公开(公告)号: | CN115995085A | 公开(公告)日: | 2023-04-21 |
发明(设计)人: | 余海涛;沙龙;洪鹏宇 | 申请(专利权)人: | 蓝舰信息科技南京有限公司 |
主分类号: | G06V30/41 | 分类号: | G06V30/41;G06V10/94;G06V10/764;G06V10/82;G06F16/55;G06F16/583;G06F16/36 |
代理公司: | 天津垠坤知识产权代理有限公司 12248 | 代理人: | 王忠玮;赵玉琴 |
地址: | 210000 江苏省南京市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 复杂 版面 图文 识别 学科 知识 图谱 嵌入 学习方法 | ||
1.一种复杂版面图文识别学科类知识图谱嵌入学习方法,其特征在于:包括以下步骤:
S1、构建知识图谱嵌入学习模型,创建图谱单元并通过三元组存储;所述图谱单元包括:知识点kp和关系r;
S2、整理知识图谱数据流整理成为大规模三元组,整合后的知识图谱嵌入学习模型包括复杂的层级和相互关联的关系;
S3、对关系r之间存在的超关系对应的进行算法设计,并对算法学习的参数进行统计;
S4、通过GPU硬件对知识图谱嵌入学习模型进行模型学习和训练,并对训练之后的模型进行验证;
S5、知识图谱嵌入学习模型进行神经网络训练,在模型收敛后对过拟合进行验证,如果验证通过则图谱嵌入学习完成,同时对下游接口设定嵌入表征存取接口需求,并发和功耗需求,完成下游接口开发。
2.根据权利要求1所述的一种复杂版面图文识别学科类知识图谱嵌入学习方法,其特征在于:所述步骤S1中,并通过神经网络对知识点kp和关系r进行分别表征,所述知识点kp包括头知识点kp1、尾知识点kp2,其中,关系r定义为从头知识点到尾知识点的运算参数。
3.根据权利要求1所述的一种复杂版面图文识别学科类知识图谱嵌入学习方法,其特征在于:所述步骤S3中,使用三维特殊正交群对知识点kp和关系r进行参数化和运算,所述统计包括总体知识点数量、关系类型数量、嵌入维度参数。
4.根据权利要求3所述的一种复杂版面图文识别学科类知识图谱嵌入学习方法,其特征在于:所述知识点kp使用n个三维坐标参数(xi,yi,zi);关系r使用欧拉角参数(φi,θi,ψi),n是超参数,所述知识点kp和关系r的运算转化为通过群运算约束的向量运算。
5.根据权利要求4所述的一种复杂版面图文识别学科类知识图谱嵌入学习方法,其特征在于:所述向量运算,使关系r满足对角矩阵运算,其中Mi是3x 3的块矩阵。
6.根据权利要求1所述的一种复杂版面图文识别学科类知识图谱嵌入学习方法,其特征在于:所述步骤S5中,所述下游接口包括向量读写接口、支持高并发批量读取和对于低功耗需求端设备运行的压缩支持接口。
7.根据权利要求2所述的一种复杂版面图文识别学科类知识图谱嵌入学习方法,其特征在于:所述关系r为导数的应用和极值。
8.根据权利要求2所述的一种复杂版面图文识别学科类知识图谱嵌入学习方法,其特征在于:所述关系r为知识点kp在知识树不同节点之间的相互关联关系,包括二次函数的性质和三次函数的性质。
9.根据权利要求1所述的一种复杂版面图文识别学科类知识图谱嵌入学习方法,其特征在于:所述步骤S4中,所述验证包括但不限于三元组补全验证、下游分类模型验证。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于蓝舰信息科技南京有限公司,未经蓝舰信息科技南京有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111215955.5/1.html,转载请声明来源钻瓜专利网。