[发明专利]文本摘要提取方法及装置在审

专利信息
申请号: 202110561021.0 申请日: 2021-05-21
公开(公告)号: CN113342968A 公开(公告)日: 2021-09-03
发明(设计)人: 申端明;李青;孙健;李楠梓;周思诗;温乾;崔玉芳 申请(专利权)人: 中国石油天然气股份有限公司
主分类号: G06F16/34 分类号: G06F16/34;G06F40/284;G06F40/194;G06N3/02
代理公司: 北京三友知识产权代理有限公司 11127 代理人: 沈珍珠;郝博
地址: 100007 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 文本 摘要 提取 方法 装置
【说明书】:

发明提供了一种文本摘要提取方法及装置,涉及自然语言处理技术领域,该方法包括:获取文本信息和文本语料词向量集合信息;对文本信息进行分词处理,根据分词处理结果和文本语料词向量集合信息确定分词处理结果中每个词语的词向量;根据词向量生成文本信息的句向量、文向量和标题向量;根据句向量、文向量和标题向量生成相似度评分;根据相似度评分确定文本信息的摘要信息。本发明利用句向量、文向量和标题向量生成相似度评分,可以提高抽取出的摘要句和原文的语义相关度,从而找出与原文中心思想非常贴近的句子,进而提升文本摘要质量。

技术领域

本发明涉及自然语言处理技术领域,尤其是涉及一种文本摘要提取方法及装置。

背景技术

自动文本摘要,简单来说,就是输入一段长文字,输出对这段长文字的一个总结概要。自动文本摘要在新闻、语音播报、文档信息提取、公司报表、上市公司分析等领域具有很多的应用场景。

随着互联网的迅速发展,信息爆炸带来的信息过载问题给人们带来了很大困扰。大量文本内容的产生,使人们需要想办法让计算机自动提取文本摘要,帮助判断文本主旨,以节省阅读时间。

以神经网络深度学习为代表的生成式文本摘要方法,虽然生成摘要的过程符合自然人抽取摘要时的思维,但是对于长文本内容生成的摘要效果并不好;而抽取式文本摘要则不受文本长度的限制,目前已有的抽取式文本摘要方法虽然结合了词频和词句的位置信息,但其得到的文本摘要质量仍有待提高。

发明内容

本发明提供了一种文本摘要提取方法及装置,可以基于原文中的句子和原文语义相关度提取摘要信息,提高文本摘要的提取的准确度。

第一方面,本发明实施例提供了一种文本摘要提取方法,该方法包括:获取文本信息和文本语料词向量集合信息;对所述文本信息进行分词处理,根据分词处理结果和所述文本语料词向量集合信息确定所述分词处理结果中每个词语的词向量;根据所述词向量生成所述文本信息的句向量、文向量和标题向量;根据所述句向量、所述文向量和所述标题向量生成相似度评分;根据所述相似度评分确定所述文本信息的摘要信息。

第二方面,本发明实施例还提供一种文本摘要提取装置,该装置包括:获取模块,用于获取文本信息和文本语料词向量集合信息;向量模块,用于对所述文本信息进行分词处理,根据分词处理结果和所述文本语料词向量集合信息确定所述分词处理结果中每个词语的词向量;计算模块,用于根据所述词向量生成所述文本信息的句向量、文向量和标题向量;语义模块,用于根据所述句向量、所述文向量和所述标题向量生成相似度评分;排序模块,用于根据所述相似度评分确定所述文本信息的摘要信息。

第三方面,本发明实施例还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述文本摘要提取方法。

第四方面,本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述文本摘要提取方法的计算机程序。

本发明实施例带来了以下有益效果:本发明实施例提供了一种文本摘要提取方案,该方案包括:获取文本信息和文本语料词向量集合信息;对文本信息进行分词处理,根据分词处理结果和文本语料词向量集合信息确定分词处理结果中每个词语的词向量;根据词向量生成文本信息的句向量、文向量和标题向量;根据句向量、文向量和标题向量生成相似度评分;根据相似度评分确定文本信息的摘要信息。本发明实施例利用句向量、文向量和标题向量生成相似度评分,可以提高抽取出的摘要句和原文的语义相关度,从而找出与原文中心思想非常贴近的句子,进而提升文本摘要质量。

本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

附图说明

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国石油天然气股份有限公司,未经中国石油天然气股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110561021.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top