[发明专利]一种文本摘要生成方法和装置有效
申请号: | 201911115181.1 | 申请日: | 2019-11-14 |
公开(公告)号: | CN110888976B | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 韩庆宏 | 申请(专利权)人: | 北京香侬慧语科技有限责任公司 |
主分类号: | G06F16/34 | 分类号: | G06F16/34 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 柳欣 |
地址: | 100080 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 摘要 生成 方法 装置 | ||
本发明提供了一种文本摘要生成方法和装置,其中,该方法包括:获取文档的文本内容,从所述文档的文本内容中提取多个文本片段形成所述文档的候选摘要文本;提取所述候选摘要文本中各字符的特征向量;根据提出的所述候选摘要文本中各字符的特征向量,对所述候选摘要文本进行修正,生成所述文档的文本摘要。通过本发明实施例提供的文本摘要生成方法和装置,可以降低生成文本摘要时的人工成本,并提高了生成文本摘要的效率。
技术领域
本发明涉及计算机技术领域,具体而言,涉及一种文本摘要生成方法和装置。
背景技术
目前,随着近几年文本信息的爆发式增长,人们每天都能够接触到海量的文档,如新闻、博客、论文、微博、聊天等,从大量文档信息中提取重要的内容,成为一个迫切需求。生成文本摘要便是一种高效的解决手段,文本摘要旨在文档基础上得到包含文档关键信息的文本摘要。用户通过阅读文本摘要就可以快速了解文档内容。
为了生成文档的文本摘要,可以先将文档输入摘要生成模型中,由摘要生成模型抽取文档中的句子形成文档的待评测文本摘要;然后由人工阅读该文档,总结该文档的中心思想,并以此对文档的上述待评测文本摘要进行修订,最终生成文档的文本摘要。
生成文档的文本摘要过程需要人工参与,具有成本高且效率低的缺陷。
发明内容
为解决上述问题,本发明实施例的目的在于提供一种文本摘要生成方法和装置。
第一方面,本发明实施例提供了一种文本摘要生成方法,包括:
获取文档的文本内容,从所述文档的文本内容中提取多个文本片段形成所述文档的候选摘要文本;
提取所述候选摘要文本中各字符的特征向量;
根据提出的所述候选摘要文本中各字符的特征向量,对所述候选摘要文本进行修正,生成所述文档的文本摘要。
第二方面,本发明实施例还提供了一种文本摘要生成装置,包括:
获取模块,用于获取文档的文本内容,从所述文档的文本内容中提取多个文本片段形成所述文档的候选摘要文本;
提取模块,用于提取所述候选摘要文本中各字符的特征向量;
生成模块,用于根据提出的所述候选摘要文本中各字符的特征向量,对所述候选摘要文本进行修正,生成所述文档的文本摘要。
本发明实施例上述第一方面至第二方面提供的方案中,通过从文档的文本内容中提取多个文本片段形成所述文档的候选摘要文本,并根据候选摘要文本中各字符的特征向量,对所述候选摘要文本进行修正,生成所述文档的文本摘要,与相关技术中生成文档的文本摘要过程需要人工参与的方式相比,可以先通过从文档中提取的多个文本片段形成所述文档的候选摘要文本,然后根据候选摘要文本中各字符的特征向量对候选摘要文本进行修正生成文档的文本摘要,生成文本摘要的过程无需人工参与,降低了生成文本摘要时的人工成本,并提高了生成文本摘要的效率。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本发明实施例1所提供的一种文本摘要生成方法的流程图;
图2示出了本发明实施例2所提供的一种文本摘要生成装置的结构示意图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京香侬慧语科技有限责任公司,未经北京香侬慧语科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911115181.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种富含活性益生菌的低盐泡菜的制备方法
- 下一篇:成像镜头