[发明专利]一种自动文本摘要生成方法、系统、计算机设备和存储介质在审
申请号: | 202110921956.5 | 申请日: | 2021-08-12 |
公开(公告)号: | CN113626584A | 公开(公告)日: | 2021-11-09 |
发明(设计)人: | 郑超;窦凤虎;张欢;顾钊铨;王乐;张登辉;韩伟红 | 申请(专利权)人: | 中电积至(海南)信息技术有限公司 |
主分类号: | G06F16/34 | 分类号: | G06F16/34;G06F16/36;G06N3/04;G06N3/08 |
代理公司: | 重庆百润洪知识产权代理有限公司 50219 | 代理人: | 李立 |
地址: | 571924 海南省海口市澄迈县老城*** | 国省代码: | 海南;46 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自动 文本 摘要 生成 方法 系统 计算机 设备 存储 介质 | ||
1.一种自动文本摘要生成方法,其特征在于,所述方法包括以下步骤:
获取原始文本和神经网络模型;
将原始文本进行切分和压缩,得到新的文本表示;
将新的文本经过句子特征向量抽取,得到文本向量矩阵;
将文本矩阵输入至双向长短记忆神经网络模型中,将文本矩阵编码成文本语义矩阵;
将文本语义矩阵输入至注意力模型和长短记忆神经网络模型中,将文本语义矩阵解码成文本向量矩阵,文本向量反映射得到文本摘要。
2.如权利要求1所述的自动文本摘要生成方法,其特征在于,所述将原始文本进行切分和压缩的步骤包括:
将文本以句子为单位进行切分,生成句子集合;
统计句子长度,并计算句子平均长度;
对于长度大于句子平均长度两倍的句子进行再切分;
更新句子集合,并将句子集合中文本长度小于3的句子去掉。
3.如权利要求1所述的自动文本摘要生成方法,其特征在于,所述将新的文本经过句子特征向量抽取,得到文本向量矩阵的步骤包括:
通过中文语言特征,构建7个句子特征;
计算每个句子的7个特征得分,组成一维向量表示每一个句子;
句子的向量组合成二维向量得到句子的向量矩阵表示。
4.如权利要求1所述的自动文本摘要生成方法,其特征在于,将文本矩阵输入至双向长短记忆神经网络模型中,将文本矩阵编码成文本语义矩阵的步骤包括:
编码器依次接收每个文本的向量化表示;
编码器输出语义向量V。
5.如权利要求1所述的自动文本摘要生成方法,其特征在于,所述将文本语义矩阵输入至注意力模型和长短记忆神经网络模型中,将文本语义矩阵解码成文本向量矩阵,文本向量反映射得到文本摘要的步骤包括:
解码器输入BOS,即文本的开始,根据BOS和语义向量V预测下一轮使用每个句子的概率,挑选概率最大的句子;
将概率最大的句子和语义向量V输入到解码器,得到下一轮的概率最大的句子,如此循环,直到得到EOS,即句子的结尾,文本摘要生成结束。
6.如权利要求3所述的句子特征向量抽取,其特征在于,所述通过中文语言特征,构建7个句子特征并得到句子特征向量的步骤包括:
对文本进行一些必要的预处理,首先将句子按照单词为单位分词,接着去除无用的功能词,然后重新合并单词组成新的句子;
综合文本句子摘要抽取的多种影响因素,选取影响效果最好的7种特征,7个特征分别是:句子相关度、句子与中心句的相似度、句子中包含关键词个数、句子中包含领域实体名词个数、句子信息度、句子长度、句子位置特征向量,对这些特征进行数学化转化,构建合理的公式,接着对每一个句子计算特征得分,每个句子得到7个特征得分构成句子特征向量。
7.一种自动文本摘要生成系统,其特征在于,所述系统包括:
样本获取模块,用于获取原始的中文长文本和神经网络模型;
文本预处理模块,用于将原始文本进行初步压缩处理,将无用的句子去掉,并通过句子再切分工作,将原始文本表示成句子集合;
文本特征表示模块,用于将句子集合中每一个句子用一维向量表示,生成文本的二维特征向量矩阵;
语义向量生成模块,用于通过神经网络模型构建文本中句子语义联系,生成文本的语义向量;
自动文本摘要生成模块,用于通过神经网络模型将语义向量和输入向量预测下一个输入向量,迭代生成输出句子特征向量,直到生成文本结束符号,最后将生成的所有句子特征向量转换成文字符号,即得到生成的文本摘要。
8.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一所述方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中电积至(海南)信息技术有限公司,未经中电积至(海南)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110921956.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种汽轮机叶片叉型叶根检测装置与方法
- 下一篇:一种头部三维重建方法及设备