[发明专利]一种结合对比学习和预训练技术的中文新闻文本摘要方法在审
申请号: | 202210623480.1 | 申请日: | 2022-06-02 |
公开(公告)号: | CN114880461A | 公开(公告)日: | 2022-08-09 |
发明(设计)人: | 林鸿飞;谭金源;杨亮 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06F16/34 | 分类号: | G06F16/34;G06F16/35;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 大连星河彩舟专利代理事务所(普通合伙) 21263 | 代理人: | 陈玲玉;杨阳 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出一种结合对比学习和预训练技术的中文新闻文本摘要方法,包括(1)构建对比学习输入数据;(2)使用结合中文新闻语料微调后的BERT预训练模型获取新闻文本的上下文向量表示,对文本中的句子进行分类打分,抽取包含关键信息的候选句得到候选句集合;(3)将候选句集合输入到结合中文新闻语料微调后的MT5模型中,生成摘要结果;(4)结合AECLoss损失函数实现抽取式模型、生成式模型的端到端训练。本发明能够结合对比学习获取更忠于原文内容的摘要结果;通过结合外部知识,提升预训练模型在新闻文本上的语义表示能力;通过先抽取后生成的摘要方式,使模型充分关注新闻文本中的关键内容,有效提升了模型的可解释性和摘要结果的连续性、可读性。 | ||
搜索关键词: | 一种 结合 对比 学习 训练 技术 中文 新闻 文本 摘要 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202210623480.1/,转载请声明来源钻瓜专利网。