[发明专利]一种基于序列到序列模型的中文文本摘要生成方法有效
申请号: | 201911391393.2 | 申请日: | 2019-12-30 |
公开(公告)号: | CN111078866B | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 尹叶龙;邓辉舫 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F16/34 | 分类号: | G06F16/34;G06F16/35;G06N3/0455;G06N3/0442;G06N3/0464;G06N3/047;G06N3/084;G06N3/0985 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 冯炳辉 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于序列到序列模型的中文文本摘要生成方法,首先对文本进行按字切分并填充到固定长度,对字向量进行高斯随机初始化;将文本编码后输入双向长短期记忆网络(LSTM),最后的输出状态作为预编码;对字向量按照不同的窗口大小做卷积神经网络(CNN),输出作为窗口词向量;构建编码器,构造一个双向LSTM,预编码作为其初始化参数,上一步的窗口词向量作为输入;构建解码器,使用单向LSTM并结合注意力机制生成文本。本发明改进了传统的序列到序列模型中的编码器,使模型在编码阶段能够获得更多的原文本的信息,最终解码出更好的文本摘要,并使用了更小细粒度的字向量,更适合中文文本。 | ||
搜索关键词: | 一种 基于 序列 模型 中文 文本 摘要 生成 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201911391393.2/,转载请声明来源钻瓜专利网。
- 上一篇:粉体高效混合容器及其粉体混合方法
- 下一篇:立卧一体式加工设备及其方法