[发明专利]摘要及对话摘要生成方法和装置在审
申请号: | 201910058041.9 | 申请日: | 2019-01-22 |
公开(公告)号: | CN111460109A | 公开(公告)日: | 2020-07-28 |
发明(设计)人: | 宋凯嵩;孙常龙;林君;刘晓钟 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/338 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 尹红敏 |
地址: | 开曼群岛*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 摘要 对话 生成 方法 装置 | ||
本发明公开了一种摘要及对话摘要生成方法和装置。本发明公开的摘要生成方法包括:获取待生成摘要的文本及文本的词向量序列;根据词向量序列,确定词袋中的各个词语在多个输出时刻的输出概率;根据各个词语在多个输出时刻的输出概率,确定各个输出时刻的输出词语,以根据输出词语生成文本对应的摘要。本发明公开的对话摘要生成方法包括:获取待生成对话摘要的对话文本;根据对话文本,确定多个子文本;利用本发明的摘要生成方法分别生成各个子文本对应的子摘要;将各个子摘要组合为对话文本对应的对话摘要。根据本发明实施例,能够准确、高效、灵活地生成文本的摘要。
技术领域
本发明属于信息处理技术领域,尤其涉及一种摘要及对话摘要生成方法和装置。
背景技术
在文字对话过程中,用户通常需要浏览全部的历史对话记录,来回顾历史对话内容,以基于历史对话内容继续进行文字对话,从而更好地进行沟通。但是,这种通过浏览全部的历史对话记录来回顾历史对话内容的方法,会导致对话的质量和效率较低,为用户带来不良的文字对话体验。
为了提高对话的质量和效率,需要提取历史对话记录的对话摘要,使用户能够快速回顾历史对话内容。
已有的解决方案中,通常采用抽取式的摘要提取方法来提取历史对话记录的对话摘要。抽取式的摘要提取方法的原理为,从历史对话记录中选择重要的文本段落,并将选择的文本段落重新组织,以形成对话摘要。但是,由于这种方法需要通过选择大段的文本段落来保证对话摘要的基本语法和准确性,使得其缺乏灵活性,无法实现对历史对话记录的解释、概括和合并。另外,这种方法一般多考虑单词的词频,而并不考虑历史对话记录的语义,不符合用户基于历史对话记录人工总结摘要的习惯。因此,利用抽取式的摘要提取方法提取的对话摘要的提取质量和内容流畅度都差强人意。
发明内容
本发明实施例提供一种摘要及对话摘要生成方法和装置,能够准确、高效、灵活地生成文本的摘要。
一方面,本发明实施例提供一种摘要生成方法,包括:
获取待生成摘要的文本及文本的词向量序列;
根据词向量序列,确定词袋中的各个词语在多个输出时刻的输出概率;
根据各个词语在多个输出时刻的输出概率,确定各个输出时刻的输出词语,以根据输出词语生成文本对应的摘要。
另一方面,本发明实施例提供了一种对话摘要生成方法,包括:
获取待生成对话摘要的对话文本;
根据对话文本,确定多个子文本;
利用如上所述的摘要生成方法分别生成各个子文本对应的子摘要;
将各个子摘要组合为对话文本对应的对话摘要。
又一方面,本发明实施例提供了一种摘要生成装置,装置包括:
文本获取单元,其配置为获取待生成摘要的文本及文本的词向量序列;
概率计算单元,其配置为根据词向量序列,确定词袋中的各个词语在多个输出时刻的输出概率;
摘要生成单元,其配置为根据各个词语在多个输出时刻的输出概率,确定各个输出时刻的输出词语,以根据输出词语生成文本对应的摘要。
再一方面,本发明实施例提供了一种对话摘要生成装置,装置包括:
对话获取单元,其配置为获取待生成对话摘要的对话文本;
对话处理单元,其配置为根据对话文本,确定多个子文本;
如上所述的摘要生成装置,其配置为分别生成各个子文本对应的子摘要;
摘要处理单元,其配置为将各个子摘要组合为对话文本对应的对话摘要。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910058041.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于判别灯影组二段和灯影组四段的装置及方法
- 下一篇:一种正负压快速切换装置