[发明专利]一种基于图卷积神经网络的文本分类方法、系统有效
申请号: | 201911393728.4 | 申请日: | 2019-12-30 |
公开(公告)号: | CN111209398B | 公开(公告)日: | 2023-01-17 |
发明(设计)人: | 李建欣;邵明来;周佰聪;孙佩源;邰振赢 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06N3/042;G06N3/047;G06N3/045;G06N3/0464;G06N3/08 |
代理公司: | 北京中创阳光知识产权代理有限责任公司 11003 | 代理人: | 尹振启 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 图卷 神经网络 文本 分类 方法 系统 | ||
1.一种基于图卷积神经网络的文本分类方法,其特征在于:包括:
步骤一:输入文本,相似性图的构建,在一个含有多个文本的数据集中,每个文本都有一个包含基本特征关键词的多维元组,基于该文本数据集,构造邻接矩阵,将每个文本定义为一个节点,两个节点之间的边的存在性由这两个节点之间的相似性决定,如果相似度大于某一特定阈值,则在这些节点之间将生成一条边,以此对图中的节点类别进行预判并构建相似性图;
步骤二:深度学习模型的构建,使用一种简化图卷积神经网络与一种图注意力神经网络,并结合Softmax函数实现;
步骤三:由相似性图和深度学习模型构成文本分类方法总体模型,输出分类后的文本,其中所述文本分类方法总体模型通过使用所述简化图卷积神经网络和所述图注意力网络并结合Softmax函数计算实现;所述简化图卷积神经网络计算方式定义为:
图注意力网络定义为:
其中αij定义为:
eij定义为:
所述相似性图的构建步骤中,两个节点之间的相似性计算方式为:
所述两个节点之间的相似性计算方式中:
γ被定义为:
对于定量度量,γ的定义为
定义dist(Av,Aw),如下所示:
2.根据权利要求1所述的一种基于图卷积神经网络的文本分类方法,其特征在于:
所述文本分类方法总体模型为:
3.一种基于图卷积神经网络的文本分类系统,其特征在于:包括:
信息输入模块,用于将外部数据库所获取的源文本进行标准化后导入;
基于图卷积神经网络的文本分类模块,应用权利要求1-2中任一所述基于图卷积神经网络的文本分类方法,对输入源文本进行分类处理;
信息输出模块,将所述基于图卷积神经网络的文本分类模块中生成的文本分类结果以新的数据库形式输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911393728.4/1.html,转载请声明来源钻瓜专利网。