[发明专利]摘要生成方法、装置和设备在审
申请号: | 201910203859.5 | 申请日: | 2019-03-18 |
公开(公告)号: | CN111723194A | 公开(公告)日: | 2020-09-29 |
发明(设计)人: | 桂敏;王睿;田俊峰 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/34 | 分类号: | G06F16/34 |
代理公司: | 北京太合九思知识产权代理有限公司 11610 | 代理人: | 孙明子 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 摘要 生成 方法 装置 设备 | ||
本发明实施例提供一种摘要生成方法、装置和设备,该方法包括:获取组成本文的多个第一语句;通过词语编码器分别对多个第一语句进行词语编码处理,得到个第一语句表示向量;通过语句编码器对多个第一语句表示向量进行句子编码处理,得到第一文本表示向量;通过语句解码器对第一文本表示向量进行解码处理,得到多个第一语句指示向量;通过词语解码器分别对多个第一语句指示向量进行解码处理,得到多个第一摘要语句,由多个第一摘要语句组成文本的摘要。在该方案中,利用文本的句子结构为文本进行摘要生成处理,使得摘要的生成质量、速度得以保证。
技术领域
本发明涉及互联网技术领域,尤其涉及一种摘要生成方法、装置和设备。
背景技术
人们每天可以接触到大量的文本信息,如新闻、报告、论文、博客等。在一种实际场景中,作者已经将文本(比如一篇小说)撰写完毕,并将撰写好的文本提交至某网络平台进行发布,为了吸引更多的读者来阅读该文本,需要为该文本生成精简的摘要信息,以使读者先了解该文本的主要内容,进而再决定是否要打开该文本仔细阅读。
过去,文本摘要都是文本的作者自行撰写完成的,作者自己撰写摘要比较费时。而有些作者也可能仅是从文本中复制一段话或几句话作为摘要,效果不佳。
发明内容
本发明实施例提供一种摘要生成方法、装置和设备,用以实现摘要的自动生成。
第一方面,本发明实施例提供一种摘要生成方法,该方法包括:
获取组成本文的多个第一语句;
通过词语编码器分别对所述多个第一语句进行词语编码处理,得到对应于所述多个第一语句的多个第一语句表示向量;
通过语句编码器对所述多个第一语句表示向量进行句子编码处理,得到对应于所述文本的第一文本表示向量;
通过语句解码器对所述第一文本表示向量进行解码处理,得到指示需解码的文本内容的多个第一语句指示向量;
通过词语解码器分别对所述多个第一语句指示向量进行解码处理,得到多个第一摘要语句,由所述多个第一摘要语句组成所述文本的摘要。
第二方面,本发明实施例提供一种摘要生成装置,该装置包括:
获取模块,用于获取组成本文的多个第一语句;
词语编码器,用于分别对所述多个第一语句进行词语编码处理,得到对应于所述多个第一语句的多个第一语句表示向量;
语句编码器,用于对所述多个第一语句表示向量进行句子编码处理,得到对应于所述文本的第一文本表示向量;
语句解码器,用于对所述第一文本表示向量进行解码处理,得到指示需解码的文本内容的多个第一语句指示向量;
词语解码器,用于分别对所述多个第一语句指示向量进行解码处理,得到多个第一摘要语句,由所述多个第一摘要语句组成所述文本的摘要。
第三方面,本发明实施例提供一种电子设备,包括处理器、存储器,所述存储器上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器至少实现上述第一方面中的摘要生成方法。
第四方面,本发明实施例提供了一种非暂时性机器可读存储介质,所述非暂时性机器可读存储介质上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器至少可以实现上述第一方面中的摘要生成方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910203859.5/2.html,转载请声明来源钻瓜专利网。