[发明专利]文本摘要的生成方法、训练方法、装置、设备及介质有效
申请号: | 201911259066.1 | 申请日: | 2019-12-10 |
公开(公告)号: | CN111026861B | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 缪畅宇 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/34 | 分类号: | G06F16/34;G06N3/0455;G06N3/084;G06N3/0442;G06N3/0464 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 邢惠童 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 摘要 生成 方法 训练 装置 设备 介质 | ||
本申请公开了一种文本摘要的生成方法、装置、设备及介质,所述方法属于计算机视觉领域,所述方法包括:获取文本内容;将所述文本内容输入编码层,得到所述文本内容的隐层嵌入向量;所述编码层是基于抽取式摘要生成模型和生成式摘要生成模型的协同训练得到的;将所述隐层嵌入向量输入所述抽取式摘要生成模型或所述生成式摘要生成模型进行处理,输出所述文本摘要。本申请能够综合抽取式摘要生成和生成式摘要生成两种方式各自的优点,从而使得最终输出的文本摘要能够更好地概括文本内容的内容特性。
技术领域
本申请实施例涉及人机交互领域,特别涉及一种文本摘要的生成方法、训练方法、装置、设备及介质。
背景技术
文本摘要生成是提取文本内容的浓缩内容的过程。对于互联网资讯产品,将好的文本摘要展示在产品界面,会极大地提高用户阅读效率,吸引用户阅读欲望。由于互联网资讯产品的内容源非常广泛,依赖人工写摘要几乎是不可能的任务,所以自动摘要技术越来越受青睐。
目前的自动摘要技术主要分为:抽取式摘要生成和生成式摘要生成。抽取式摘要生成是抽取文本内容中的重要句子作为摘要,生成式摘要生成是模仿人类写作过程写一段自己的话来做总结。显然,后者更符合人们对摘要的预期,也更能吸引用户阅读。
虽然抽取式摘要生成和生成式摘要生成各有优点,但相关技术中只会根据应用场景使用其中一种摘要生成方式,所生成的摘要质量较差。
发明内容
本申请实施例提供了一种文本摘要的生成方法、训练方法、装置、设备及介质,可以解决虽然抽取式摘要生成和生成式摘要生成各有优点,但相关技术中只会根据应用场景使用其中一种摘要生成方式,所生成的摘要质量较差。所述技术方案如下:
根据本申请的一个方面,提供了一种文本摘要的生成方法,所述方法包括:
获取文本内容;
将所述文本内容输入编码层,得到所述文本内容的隐层嵌入向量;所述编码层是基于抽取式摘要生成模型和生成式摘要生成模型的协同训练得到的;
将所述隐层嵌入向量输入所述抽取式摘要生成模型或所述生成式摘要生成模型进行处理,输出所述文本摘要。
根据本申请的一个方面,提供了一种用于文本摘要生成的模型训练方法,所述方法包括:
获取摘要生成模型,所述摘要生成模型包括:编码层、与所述编码层相连的抽取式摘要生成模型和生成式摘要生成模型;
采用第一训练样本和第二训练样本对所述摘要生成模型进行协同训练,所述第一训练样本是所述抽取式摘要生成模型对应的训练样本,所述第二训练样本是所述生成式摘要生成模型对应的训练样本;
在满足训练结束条件时,得到训练后的摘要生成模型。
根据本申请的一个方面,提供了一种文本摘要的生成装置,所述装置包括:
获取模块,用于获取文本内容;
特征提取模块,用于将所述文本内容输入编码层,得到所述文本内容的隐层嵌入向量;所述编码层是基于抽取式摘要生成模型和生成式摘要生成模型的协同训练得到的;
摘要生成模块,用于将所述隐层嵌入向量输入所述抽取式摘要生成模型或所述生成式摘要生成模型进行处理,输出所述文本摘要。
根据本申请的一个方面,提供了一种用于文本摘要生成的模型训练装置,其特征在于,所述装置包括:
获取模块,用于获取摘要生成模型,所述摘要生成模型包括:编码层、与所述编码层相连的抽取式摘要生成模型和生成式摘要生成模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911259066.1/2.html,转载请声明来源钻瓜专利网。