[发明专利]摘要及对话摘要生成方法和装置在审

专利信息
申请号: 201910058041.9 申请日: 2019-01-22
公开(公告)号: CN111460109A 公开(公告)日: 2020-07-28
发明(设计)人: 宋凯嵩;孙常龙;林君;刘晓钟 申请(专利权)人: 阿里巴巴集团控股有限公司
主分类号: G06F16/332 分类号: G06F16/332;G06F16/338
代理公司: 北京东方亿思知识产权代理有限责任公司 11258 代理人: 尹红敏
地址: 开曼群岛*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 摘要 对话 生成 方法 装置
【权利要求书】:

1.一种摘要生成方法,其特征在于,包括:

获取待生成摘要的文本及所述文本的词向量序列;

根据所述词向量序列,确定词袋中的各个词语在多个输出时刻的输出概率;

根据所述各个词语在多个输出时刻的输出概率,确定各个输出时刻的输出词语,以根据所述输出词语生成所述文本对应的摘要。

2.根据权利要求1所述的摘要生成方法,其特征在于,所述根据所述词向量序列,确定词袋中的各个词语在多个输出时刻的输出概率,包括:

将所述词向量序列输入编码器,获得所述词向量序列对应的第一隐含状态序列;

将所述第一隐含状态序列输入解码器,解码所述摘要对应的第二隐含状态序列;

根据所述第一隐含状态序列和所述第二隐含状态序列,确定词袋中的各个词语在多个输出时刻的输出概率。

3.根据权利要求2所述的摘要生成方法,其特征在于,所述根据所述第一隐含状态序列和所述第二隐含状态序列,确定词袋中的各个词语在多个输出时刻的输出概率,包括:

根据各个输出时刻对应的第二隐含状态向量以及在各个输出时刻的前一时刻的输出词语的词向量,确定所述词向量序列在各个输出时刻对应的注意力分布;

根据各个输出时刻对应的注意力分布和所述第一隐含状态序列,计算所述文本在各个输出时刻的语境向量;

根据各个输出时刻的语境向量和所述第二隐含状态序列,确定词袋中的各个词语在多个输出时刻的输出概率。

4.根据权利要求3所述的摘要生成方法,其特征在于,所述根据所述词向量序列,确定词袋中的各个词语在多个输出时刻的输出概率,还包括:

根据所述语境向量、所述第二隐含状态序列和在各个输出时刻的前一时刻的输出词语的词向量,计算各个输出时刻的词语生成概率;

根据所述各个输出时刻的词语生成概率和注意力分布,修正所述词袋中的各个词语在各个输出时刻的输出概率。

5.根据权利要求2所述的摘要生成方法,其特征在于,所述编码器至少包括双向LSTM模型、双向GRU模型、深层LSTM模型、深层双向LSTM模型和单层双向LSTM模型。

6.根据权利要求2所述的摘要生成方法,其特征在于,所述解码器至少包括单层单向LSTM模型。

7.根据权利要求1所述的摘要生成方法,其特征在于,所述根据所述各个词语在多个输出时刻的输出概率,确定各个输出时刻的输出词语,包括:

选取所述词袋中各个输出时刻的输出概率最大的词语作为各个输出时刻的输出词语。

8.根据权利要求1所述的摘要生成方法,其特征在于,所述根据所述输出词语生成所述文本对应的摘要后,还包括:

确定所述摘要中的各个输出词语对应的覆盖率向量;

根据所述覆盖率向量,确定所述摘要的损失函数,以优化计算所述输出概率的参数。

9.一种对话摘要生成方法,其特征在于,包括:

获取待生成对话摘要的对话文本;

根据所述对话文本,确定多个子文本;

利用如权利要求1-8任一项所述的摘要生成方法分别生成各个子文本对应的子摘要;

将各个子摘要组合为所述对话文本对应的对话摘要。

10.一种摘要生成装置,其特征在于,所述装置包括:

文本获取单元,其配置为获取待生成摘要的文本及所述文本的词向量序列;

概率计算单元,其配置为根据所述词向量序列,确定词袋中的各个词语在多个输出时刻的输出概率;

摘要生成单元,其配置为根据所述各个词语在多个输出时刻的输出概率,确定各个输出时刻的输出词语,以根据所述输出词语生成所述文本对应的摘要。

11.一种对话摘要生成装置,其特征在于,所述装置包括:

对话获取单元,其配置为获取待生成对话摘要的对话文本;

对话处理单元,其配置为根据所述对话文本,确定多个子文本;

如权利要求10所述的摘要生成装置,其配置为分别生成各个子文本对应的子摘要;

摘要处理单元,其配置为将各个子摘要组合为所述对话文本对应的对话摘要。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910058041.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top