[发明专利]基于BERT-A-BiLSTM的多特征专利自动分类算法在审

专利信息
申请号: 202110445688.4 申请日: 2021-04-25
公开(公告)号: CN113011527A 公开(公告)日: 2021-06-22
发明(设计)人: 和志强;陈萌;罗长玲;王梦雪;马宁 申请(专利权)人: 河北经贸大学
主分类号: G06K9/62 分类号: G06K9/62;G06F40/30;G06F40/44;G06N3/04;G06N3/08
代理公司: 北京华际知识产权代理有限公司 11676 代理人: 陈健阳
地址: 050000 *** 国省代码: 河北;13
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 bert bilstm 特征 专利 自动 分类 算法
【说明书】:

本发明属于专利自动分类技术领域,具体涉及基于BERT‑A‑BiLSTM的多特征专利自动分类算法,包括BERT‑A‑BiLSTM的多特征分类算法模型构建、实验设计与对比分析,BERT‑A‑BiLSTM的多特征分类算法模型构建包括“文本向量化表示层”、“文本特征提取层”、“输出层”,“文本向量化表示层”将文本数据通过BERT模型转化为深度神经网络可识别的向量形式,“文本特征提取层”由基于BiLSTM和Attention机制的“语义特征提取模块”和基于改进型TF‑IDF算法的“统计特征提取模块”两个模块构成,其最终输出为两个模块单独的输出拼接而成,最后将文本的融合特征输入到由“全连接层加Softmax函数”组合而成“输出层”中得到分类结果。通过实验证明,该算法可以有效地提升专利的分类效果。

技术领域

本发明属于专利自动分类技术领域,具体涉及基于BERT-A-BiLSTM的多特征专利自动分类算法。

背景技术

现有的专利自动分类算法进行文本向量化时大都采用Word2vec、GloVe等静态词向量技术,不能根据上下文的变化动态的改变词向量解决一词多义问题,Word2vec模型训练的词向量不能跟随文本中上下文语境的变化而动态的改变,无法解决一词多义的问题,并且专利摘要文本具有专业领域相关词汇多、文本长度短的特点,仅通过语义特征难以对专利类别进行准确的划分,从而影响整体算法的分类性能。同时,处理专利文本序列数据时,双向长短时记忆神经网络进行文本特征提取,使用最后一个时序输出的结果作为最终特征提取的结果,但该特征难以包含文本的全部信息以导致丢失文本的部分信息,影响最终的分类效果的问题。

发明内容

本发明的目的在于提供基于BERT-A-BiLSTM的多特征专利自动分类算法,以解决上述背景技术中提出的问题。

为实现上述目的,本发明提供如下技术方案:基于BERT-A-BiLSTM的多特征专利自动分类算法,包括BERT-A-BiLSTM的多特征分类算法模型构建、实验设计与对比分析,其特征在于:所述BERT-A-BiLSTM的多特征分类算法模型构建包括“文本向量化表示层”、“文本特征提取层”、“输出层”,所述“文本向量化表示层”的输入数据中的字符映射为“字向量”,“段向量”,“位置向量”,三个向量输入Transformer编码器中,Transformer编码器由多个“注意力机制层(Multi-Head Attention)”、前馈神经网络层(Feed Forward)和“LayerNormalization层”连接而成,所述“文本特征提取层”由“BiLSTM-Attention的语义特征提取模块”和“CTF-IDF的统计特征提取模块”组成,并通过所述“输出层”进行分类,并通过实验设计,将SVM、Word2vec-BiLSTM、BERT-BiLSTM、BERT、BERT-A-BiLSTM作为对比试验进行对比分析,并通过与SVM、Word2vec-BiLSTM、BERT-BiLSTM、BERT、BERT-A-BiLSTM等算法进行对比试验,分析本发明的优越性。

作为一种优选的实施方式,所述“Multi-Head Attention特征提取”公式为MultiHead(Q,K,V)=Concat(head1,...,headh)W0 headi=Attention(QWiQ,KWiK,VWiV),W0为head拼接后还原维度的权重矩阵,WiQ,WiK,WiV分别为Q,K,V的权重矩阵,所述“Multi-HeadAttention特征提取”中Attention的计算公式,Q,K,V分别为输入query、key、value向量,dk为向量的维度。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河北经贸大学,未经河北经贸大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110445688.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top