[发明专利]一种基于图卷积网络的甲骨字分类方法在审
申请号: | 202111322101.7 | 申请日: | 2021-11-09 |
公开(公告)号: | CN114037872A | 公开(公告)日: | 2022-02-11 |
发明(设计)人: | 刘国英;焦清局;吴亮;葛文英 | 申请(专利权)人: | 安阳师范学院 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06K9/62;G06N3/04;G06F40/30 |
代理公司: | 西安铭泽知识产权代理事务所(普通合伙) 61223 | 代理人: | 韩晓娟 |
地址: | 455000 河南*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 图卷 网络 甲骨 分类 方法 | ||
1.一种基于图卷积网络的语义相似甲骨字分类方法,其特征在于,包括:
利用甲骨文拓片卜辞,建立甲骨字语境网络;
利用甲骨字构件,建立甲骨字形网络;
根据收集的语义相似甲骨字,抽取甲骨字语境子网络和甲骨字字形子网络;
融合甲骨字字形子网络和甲骨字语境子网络;
将融合后的语义相似的甲骨字字形子网络和甲骨字语境子网络输入图卷积网络,对甲骨字进行分类。
2.如权利要求1所述的一种基于图卷积网络的甲骨字分类方法,其特征在于,建立甲骨字语境网络包括:
选定一片含有n个甲骨字的拓片O=[1,2,…,i,…,j,…,n];
定义拓片上的两个甲骨字i和j之间的距离wij,并把wij值赋予语境网络的相似性矩阵Mij处;其中,wij的表达式式为:
式中,li和lj表示甲骨字i和j在拓片中的位置,并且字j在字i的后面,β表示残缺甲骨字之间的距离;
在不同的甲骨字拓片上同时出现两个甲骨字,分别计算这两个甲骨字在不同甲骨字拓片上的相似性距离,然后相加赋予相似性矩阵对应的位置上;
根据71455片拓片,得到6199个甲骨字之间的相似性矩阵,相似性矩阵共包含160964条边,其中包含甲骨异体字。
3.如权利要求1所述的一种基于图卷积网络的甲骨字分类方法,其特征在于,所述建立甲骨字形网络包括:
以173个甲骨字部首为参照数据,对6199个甲骨字按照构件进行拆分,共得到3079个甲骨字构件;
每个甲骨字i用3079个构件中的某几个构件来表示:γ(i):g1,g2,g3,…;
根据公共邻居指标计算i和j之间的权重,建立了一个包含5890个节点和1198652条边的甲骨字形网络,相似性矩阵矩阵表示为S,其中公共邻居指标表达式为:
Sij=|γ(i)∩γ(j)|
式中,γ(i)和γ(j)分别为甲骨字i和j的构件集合。
4.如权利要求1所述的一种基于图卷积网络的甲骨字分类方法,其特征在于,所述抽取甲骨字语境子网络和甲骨字字形子网络包括:
从甲骨字库中整理出字形差别较大且异体甲骨字的语义相似数量为5以及以上的异体甲骨字VO,其中异体甲骨字的语义相似或相同;
对于语境网络中的每一条边eij,如果连接eij的两个结点i和j属于VO,把边加入到子语境网络中NV;
重复上一步,直到处理完所有边;
通过删除权重小于5的边,得到一个包含1392个节点和41821条加权边的甲骨字语境子网络,其相似性矩阵可表示为MS;
利用同样的方法,从甲骨字字形网络中抽象出一个具有1428个节点和57985个加权边的甲骨字字形子网络,其中,其相似性矩阵可表示为SS。
5.如权利要求1所述的一种基于图卷积网络的甲骨字分类方法,其特征在于,所述融合甲骨字字形子网络和甲骨字语境子网络包括:
选定甲骨字字形子网络;
把甲骨字语境子网络,结点集合为Nc,添加到甲骨字字形子网络中:
如果甲骨字语境子网络中的一条边的两个结点属于甲骨字字形子网络的结点NS,然后把边加入到甲骨字字形子网络中;
重复上一步直到处理完甲骨字语境子网络中所有的边,得到含有452个结点和6990条边的融合网络NF。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安阳师范学院,未经安阳师范学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111322101.7/1.html,转载请声明来源钻瓜专利网。