[发明专利]一种融合全局和局部语义特征的文本摘要生成方法及系统在审
申请号: | 202310096168.6 | 申请日: | 2023-02-10 |
公开(公告)号: | CN116069924A | 公开(公告)日: | 2023-05-05 |
发明(设计)人: | 袁非牛;戴维;汪春梅 | 申请(专利权)人: | 上海师范大学 |
主分类号: | G06F16/34 | 分类号: | G06F16/34;G06F18/25;G06N3/08;G06N3/0455;G06N3/0442;G06N3/0464 |
代理公司: | 上海唯智赢专利代理事务所(普通合伙) 31293 | 代理人: | 刘朵朵 |
地址: | 200234 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 全局 局部 语义 特征 文本 摘要 生成 方法 系统 | ||
1.一种融合全局和局部语义特征的文本摘要生成方法,其特征在于,包括如下步骤:
(1)接收待生成摘要的文本,并进行预处理;
(2)构建文本摘要生成模型,所述模型包括:全局语义特征提取模块和局部语义特征提取模块、注意力机制以及基于指针机制的解码层;
将所述预处理后的文本分别输入全局语义特征提取模块和局部语义特征提取模块,得到全局语义特征向量和局部语义特征向量;将所述全局语义特征向量和局部语义特征向量输入注意力机制中进行融合,得到融合全局和局部语义特征的上下文向量;
根据得到的所述上下文向量,输入基于指针机制的解码层,得到最终生成的文本摘要;
(3)基于损失函数对模型进行训练,得到训练好的所述文本摘要生成模型;
(4)将经过步骤(1)处理后的待生成摘要的文本,输入训练好的所述文本摘要生成模型,生成文本摘要。
2.根据权利要求1所述的融合全局和局部语义特征的文本摘要生成方法,其特征在于,所述预处理具体包括:
使用jieba分词器对文本进行分词处理;
去除无用的标签、特殊符号和停用词;
对于过长的所述文本进行截断处理。
3.根据权利要求1所述的融合全局和局部语义特征的文本摘要生成方法,其特征在于:
所述全局语义特征提取模块由卷积神经网络和单层双向的长短期序列网络组成,将卷积神经网络CNN和双向长短期记忆网络Bi-LSTM的输出进行融合,得到全局语义特征向量;
所述局部语义特征提取模块由keybert关键词提取器和基于transformer的多头自注意力机制组成。
4.根据权利要求3所述的融合全局和局部语义特征的文本摘要生成方法,其特征在于,将卷积神经网络CNN和双向长短期记忆网络Bi-LSTM的输出进行融合具体为:
(2.1)所述预处理后的文本输入所述卷积神经网络CNN,计算公式如下:
mi=f(Wcxi:h+h-1+bc)
其中,h指的是卷积核的长度,xi:i+h-1表示所述预处理后的文本中从第i个词向量开始到h个词向量组成的矩阵,f表示非线性激活函数,bc为偏置项,Wc表示卷积核;
(2.2)所述预处理后的文本输入所述双向长短期记忆网络Bi-LSTM,计算公式如下:
其中,和分别表示该单词在Bi-LSTM隐藏层的正向状态和反向状态表示,hi表示Bi-LSTM编码器隐藏层状态;
(2.3)融合得到全局语义特征向量:
pi=hi+mi
其中:pi为全局语义特征向量。
5.根据权利要求3所述的融合全局和局部语义特征的文本摘要生成方法,其特征在于,所述keybert关键词提取器具体过程如下:
首先使用BERT获取所述预处理后的文本的向量级表示,随后针对n元词组或短语与所述预处理后的文本向量进行相似度计算,根据结果查找出相似度最高的词组或短语,并将其作为关键词提取出来。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海师范大学,未经上海师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310096168.6/1.html,转载请声明来源钻瓜专利网。