[发明专利]摘要生成方法、装置、计算机系统及可读存储介质在审
申请号: | 202110293478.8 | 申请日: | 2021-03-18 |
公开(公告)号: | CN113010666A | 公开(公告)日: | 2021-06-22 |
发明(设计)人: | 袁鹏;李浩然;徐松 | 申请(专利权)人: | 京东数字科技控股股份有限公司 |
主分类号: | G06F16/34 | 分类号: | G06F16/34;G06F16/36;G06F40/126;G06F40/216;G06F40/289;G06N3/04;G06N3/08 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 孙蕾 |
地址: | 100176 北京市大兴区北京经*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 摘要 生成 方法 装置 计算机系统 可读 存储 介质 | ||
本公开提供了一种摘要生成方法,包括:获取用于描述目标对象的文本数据,其中,文本数据包括结构化知识图谱和非结构化描述文本;对结构化知识图谱和非结构化描述文本分别进行编码,生成与结构化知识图谱对应的第一编码器隐层序列,和与非结构化描述文本对应的第二编码器隐层序列;根据第一编码器隐层序列和第二编码器隐层序列,生成文本数据的摘要。本公开还提供了摘要生成装置、计算机系统、可读存储介质以及计算机程序产品。
技术领域
本公开涉及计算机技术领域,更具体地,涉及一种摘要生成方法、装置、计算机系统、可读存储介质及计算机程序产品。
背景技术
摘要生成技术,一般是用一些精炼的短小的文本来概括一些海量的信息的大意。用户通过阅读摘要就可以了解原信息要表达的意思。该摘要生成技术应用在我们生活的方方面面,例如,新闻关键词的提炼、搜索引擎的搜索结果优化以及购物平台的商品推荐等等。利用摘要生成技术,使阅读者能够快速的获取有效信息,节省时间,提高效率。
在实现本公开构思的过程中,发明人发现相关技术中至少存在如下问题:现有摘要生成方法没有对原信息进行充分挖掘和参考,导致生成的摘要质量较低。
发明内容
有鉴于此,本公开提供了一种摘要生成方法、装置、计算机系统、可读存储介质及计算机程序产品。
本公开的一个方面提供了一种摘要生成方法,包括:
获取用于描述目标对象的文本数据,其中,文本数据包括结构化知识图谱和非结构化描述文本;
对结构化知识图谱和非结构化描述文本分别进行编码,生成与结构化知识图谱对应的第一编码器隐层序列,和与非结构化描述文本对应的第二编码器隐层序列;以及
根据第一编码器隐层序列和第二编码器隐层序列,生成文本数据的摘要。
根据本公开的实施例,其中,根据第一编码器隐层序列和第二编码器隐层序列,生成文本数据的摘要包括:
对第一编码器隐层序列进行解码,生成结构化知识图谱的第一摘要词的复制概率;
对第二编码器隐层序列进行解码,生成非结构化描述文本的第二摘要词的复制概率和与非结构化描述文本对应的第三摘要词的生成概率;
基于第一摘要词的复制概率、第二摘要词的复制概率和第三摘要词的生成概率,得到融合概率;以及
根据融合概率,生成文本数据的摘要。
根据本公开的实施例,其中,对第二编码器隐层序列进行解码,生成非结构化描述文本的第二摘要词的复制概率和与非结构化描述文本对应的第三摘要词的生成概率包括:
对第二编码器隐层序列进行处理,生成解码器隐层序列和上下文向量序列;
基于解码器隐层序列和上下文向量序列,生成与非结构化描述文本对应的第三摘要词的生成概率;
基于解码器隐层序列和上下文向量序列,生成非结构化描述文本的第二摘要词的注意力权重;以及
基于第二摘要词的注意力权重,生成第二摘要词的复制概率。
根据本公开的实施例,其中,结构化知识图谱包括属性标识和属性值;
第一编码器隐层序列包括属性标识隐层序列和属性值隐层序列。
根据本公开的实施例,其中,对第一编码器隐层序列进行解码,生成结构化知识图谱的第一摘要词的复制概率包括:
基于解码器隐层序列和上下文向量序列,对属性标识隐层序列和属性值隐层序列分别进行处理,生成与属性标识语义向量对应的属性标识注意力权重,和与属性值语义向量对应的属性值注意力权重;以及
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东数字科技控股股份有限公司,未经京东数字科技控股股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110293478.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:乘务员座椅
- 下一篇:一种具有驱蚊、止痒的天然植物制剂组合物