[发明专利]一种自动文本摘要生成方法、系统、计算机设备和存储介质在审

专利信息
申请号: 202110921956.5 申请日: 2021-08-12
公开(公告)号: CN113626584A 公开(公告)日: 2021-11-09
发明(设计)人: 郑超;窦凤虎;张欢;顾钊铨;王乐;张登辉;韩伟红 申请(专利权)人: 中电积至(海南)信息技术有限公司
主分类号: G06F16/34 分类号: G06F16/34;G06F16/36;G06N3/04;G06N3/08
代理公司: 重庆百润洪知识产权代理有限公司 50219 代理人: 李立
地址: 571924 海南省海口市澄迈县老城*** 国省代码: 海南;46
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 自动 文本 摘要 生成 方法 系统 计算机 设备 存储 介质
【权利要求书】:

1.一种自动文本摘要生成方法,其特征在于,所述方法包括以下步骤:

获取原始文本和神经网络模型;

将原始文本进行切分和压缩,得到新的文本表示;

将新的文本经过句子特征向量抽取,得到文本向量矩阵;

将文本矩阵输入至双向长短记忆神经网络模型中,将文本矩阵编码成文本语义矩阵;

将文本语义矩阵输入至注意力模型和长短记忆神经网络模型中,将文本语义矩阵解码成文本向量矩阵,文本向量反映射得到文本摘要。

2.如权利要求1所述的自动文本摘要生成方法,其特征在于,所述将原始文本进行切分和压缩的步骤包括:

将文本以句子为单位进行切分,生成句子集合;

统计句子长度,并计算句子平均长度;

对于长度大于句子平均长度两倍的句子进行再切分;

更新句子集合,并将句子集合中文本长度小于3的句子去掉。

3.如权利要求1所述的自动文本摘要生成方法,其特征在于,所述将新的文本经过句子特征向量抽取,得到文本向量矩阵的步骤包括:

通过中文语言特征,构建7个句子特征;

计算每个句子的7个特征得分,组成一维向量表示每一个句子;

句子的向量组合成二维向量得到句子的向量矩阵表示。

4.如权利要求1所述的自动文本摘要生成方法,其特征在于,将文本矩阵输入至双向长短记忆神经网络模型中,将文本矩阵编码成文本语义矩阵的步骤包括:

编码器依次接收每个文本的向量化表示;

编码器输出语义向量V。

5.如权利要求1所述的自动文本摘要生成方法,其特征在于,所述将文本语义矩阵输入至注意力模型和长短记忆神经网络模型中,将文本语义矩阵解码成文本向量矩阵,文本向量反映射得到文本摘要的步骤包括:

解码器输入BOS,即文本的开始,根据BOS和语义向量V预测下一轮使用每个句子的概率,挑选概率最大的句子;

将概率最大的句子和语义向量V输入到解码器,得到下一轮的概率最大的句子,如此循环,直到得到EOS,即句子的结尾,文本摘要生成结束。

6.如权利要求3所述的句子特征向量抽取,其特征在于,所述通过中文语言特征,构建7个句子特征并得到句子特征向量的步骤包括:

对文本进行一些必要的预处理,首先将句子按照单词为单位分词,接着去除无用的功能词,然后重新合并单词组成新的句子;

综合文本句子摘要抽取的多种影响因素,选取影响效果最好的7种特征,7个特征分别是:句子相关度、句子与中心句的相似度、句子中包含关键词个数、句子中包含领域实体名词个数、句子信息度、句子长度、句子位置特征向量,对这些特征进行数学化转化,构建合理的公式,接着对每一个句子计算特征得分,每个句子得到7个特征得分构成句子特征向量。

7.一种自动文本摘要生成系统,其特征在于,所述系统包括:

样本获取模块,用于获取原始的中文长文本和神经网络模型;

文本预处理模块,用于将原始文本进行初步压缩处理,将无用的句子去掉,并通过句子再切分工作,将原始文本表示成句子集合;

文本特征表示模块,用于将句子集合中每一个句子用一维向量表示,生成文本的二维特征向量矩阵;

语义向量生成模块,用于通过神经网络模型构建文本中句子语义联系,生成文本的语义向量;

自动文本摘要生成模块,用于通过神经网络模型将语义向量和输入向量预测下一个输入向量,迭代生成输出句子特征向量,直到生成文本结束符号,最后将生成的所有句子特征向量转换成文字符号,即得到生成的文本摘要。

8.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一所述方法的步骤。

9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一所述方法的步骤。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中电积至(海南)信息技术有限公司,未经中电积至(海南)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110921956.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top