[发明专利]一种可控情感与风格的古诗生成方法有效
申请号: | 202011129127.5 | 申请日: | 2020-10-21 |
公开(公告)号: | CN112256829B | 公开(公告)日: | 2022-11-11 |
发明(设计)人: | 邵一展;汪鹏;邵彤;高捷 | 申请(专利权)人: | 东南大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/335;G06F16/35;G06F16/383 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 蒋昱 |
地址: | 210096 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 可控 情感 风格 古诗 生成 方法 | ||
本发明提出一种可控情感与风格的古诗生成方法,其由古诗分类、古诗生成、古诗评分与交互三个模块组成。本发明首先对语料库古诗依据风格、情感、主关键词细粒度分类,随后根据用户给定的格式、风格、情感和输入文本确定对应标签,自动生成风格可控、情感可控的押韵诗句,同时能与用户进行交互实现修改与润色,采用了编码器预训练模型和带掩膜的自注意力机制保证了生成诗句与多标签之间的自动关联。自动评测与人工评测均表明,本发明能生成情感与风格均可控的诗歌,且诗歌质量超过评测基线水平。
技术领域
本发明属于人工智能技术领域,涉及古诗文本生成技术,特别涉及一种可控情感与风格的古诗生成技术。
背景技术
古诗生成系统旨在根据用户需求,生成用户满意的押韵诗歌,这首先需要写诗系统要能根据用户提供的文本信息分析、抽取、概括出适合古诗的关键词,通过关键词与用户的其他需求进行古诗生成与校正。在古诗生成之后,写诗系统还要能进行自动评分与交互,继续修改与润色生成的古诗。
目前,古诗生成领域已有许多可以生成押韵且满足用户需求诗歌的模型,但这些模型都仅仅只能根据单个关键词生成诗句,导致生成的古诗通常前言不搭后语,语意连贯度不高。并且这些模型没有同时考虑到风格、情感对于古诗的影响,因此,这些模型生成的诗句缺乏多样性,且大多数是和用户意图不匹配的。能根据用户给定的多个关键词、情感、风格自动生成押韵古诗的系统,具有很高的应用价值且可以更好地实现生成古诗的适配性与多样性。
发明内容
为解决上述问题,本发明根据解码器预训练模型和带掩膜的自注意力机制,提出了一种可控情感与风格的古诗生成方法。本方法首先利用人工本方法人工检索与机器自动计算相似度相结合的方法,对训练古诗语料库按情感标签、风格标签、主关键词标签细粒度分类,预处理后利用解码器模型进行预训练。本方法其次可以根据用户的文本信息筛选、校正、分配出主关键词标签与副关键词标签,并将前者与给定的格式标签、风格标签、情感标签进行组合形成标签集,与副关键词标签共同作用实现古诗生成。本方法最后还支持用户对生成古诗进行评分与交互,实现修改与润色的功能。本方法生成的押韵古诗可以同时满足风格、情感的限制且具有更多的关键词标签,更好地理解了用户需求,同时也进一步增强了古诗的多样性,本发明提供了一种可控情感与风格的古诗生成方法,包括如下模块:
1)古诗分类:对收集的海量古诗依据风格标签、情感标签、主关键词标签进行分类,根据预先人工精确分类的有标签古诗,采用诗词向量的余弦距离判断相似度的方法对无标签古诗进行风格、情感分类,采用检索同义词的方法对对无标签古诗进行主关键词分类,
将每首语料库古诗预处理成统一格式,输入解码器模型进行预训练;
2)古诗生成:采用带掩膜的自注意力机制屏蔽到后续信息,增强对标签的关注并实现古诗生成,首先对输入的文本进行关键词筛选、关键词校正和关键词分配,将文本分词后筛选出概括性关键词,并根据古诗语料进行校正,分配出主关键词标签与副关键词标签,之后,将用户给定的格式标签、风格标签、情感标签和主关键词标签包装成标签集,解码器预训练模型再根据模块1)分类的训练语料库、标签集与副关键词标签自动生成关联诗句,且进行格式和韵律的检查;
3)古诗评分和交互:本方法对传统文本生成的评价指标进行微调,令其适用于古诗生成评价,并将训练语料中的名诗名篇标记为优秀集,对模块2)生成的古诗质量进行自动评分,同时也支持人工对其情感标签、风格标签的契合度进行评分;用户还可以对生成诗歌不满意的位置进行修改与润色,并且本方法会对指定修改位置提供替换词,以达到人机交互、共同润色的作用。
作为本发明进一步改进,步骤1)中对收集的海量古诗依据风格标签、情感标签、主关键词标签进行分类,采用人工检索与机器自动计算相似度相结合的方法,构建按情感标签、风格标签、主关键词标签细粒度分类的训练古诗语料库和由名诗名篇组成的优秀集,本方法能依据前者进行自关联训练,依据后者和微调后的评价指标进行自动评分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011129127.5/2.html,转载请声明来源钻瓜专利网。