[发明专利]文本摘要提取方法、装置、电子设备及存储介质在审

申请号：	202011435074.X	申请日：	2020-12-10
公开（公告）号：	CN112528013A	公开（公告）日：	2021-03-19
发明（设计）人：	陈军;庄伯金;王少军	申请（专利权）人：	平安科技（深圳）有限公司
主分类号：	G06F16/34	分类号：	G06F16/34;G06F40/205
代理公司：	深圳市沃德知识产权代理事务所(普通合伙) 44347	代理人：	高杰;于志光
地址：	518000 广东省深圳市福田区福***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	文本摘要提取方法装置电子设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及自然语言处理技术，揭露一种文本摘要提取方法，包括：在Bert模型中添加奇偶句编码层得到编码器，从transformer模型中提取解码器，组合所述编码器和所述解码器得到待训练文本摘要提取模型，对训练文本集执行分句操作得到训练语段集，接收用户在所述训练语段集中添加的特征提取标识符，利用所述训练语段集及所述特征提取标识符训练所述待训练文本摘要提取模型，得到文本摘要提取模型，接收摘要待提取文本，将所述摘要待提取文本输入至所述文本摘要提取模型得到文本摘要。本发明还揭露文本摘要提取装置、电子设备以及存储介质。本发明可解决文本摘要提取过程中，缺少对文本奇偶句划分及重要语段识别的能力，进而影响文本摘要提取准确率的问题。

技术领域

本发明涉及自然语言处理领域，尤其涉及一种文本摘要提取方法、装置、电子设备及计算机可读存储介质。

背景技术

伴随人工智能的快速发展，目前涌现多种文本摘要提取方法，其中传统机器学习缺乏对海量文本数据特征提取的能力，已逐渐被深度学习方法替代去执行文本摘要提取。

目前常用transformer模型实现对文本摘要提取，但transformer模型由于缺少对文本奇偶句划分后的特征提取及文本中重要语段识别的能力，进而导致文本摘要提取的准确率有进一步提高的空间。

发明内容

本发明提供一种文本摘要提取方法、装置、电子设备及计算机可读存储介质，其主要目的在于解决在文本摘要提取过程中，缺少对文本奇偶句划分后的特征提取及文本重要语段识别的能力，进而影响文本摘要提取准确率的问题。

为实现上述目的，本发明提供的一种文本摘要提取方法，包括：

在预构建的Bert模型中添加奇偶句编码层，得到编码器；

从预接收的transformer模型中提取解码器，组合所述编码器和所述解码器，得到待训练文本摘要提取模型；

接收训练文本集，对所述训练文本集执行分句操作，得到训练语段集；

接收用户在所述训练语段集中添加的特征提取标识符；