[发明专利]一种自动生成诗歌的方法及系统在审
申请号: | 201811392886.3 | 申请日: | 2018-11-21 |
公开(公告)号: | CN111291536A | 公开(公告)日: | 2020-06-16 |
发明(设计)人: | 孙茂松;矣晓沅;李若愚;李文浩 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F40/166 | 分类号: | G06F40/166;G06F40/211;G06F40/30;G06Q10/06 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;吴欢燕 |
地址: | 100084 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自动 生成 诗歌 方法 系统 | ||
1.一种自动生成诗歌的方法,其特征在于,包括:
根据若干个关键词和预设诗歌生成器,获取若干首诗歌;
利用每一评分器对每一首诗歌进行评价,获取每一首诗歌的每一指标评分,每一评分器根据目标诗歌的每一评价指标构建;
根据每一首诗歌的每一指标评分,获取每一首诗歌的综合评分;
根据每一首诗歌的综合评分,对所述预设诗歌生成器的参数进行优化,直到更新后的预设诗歌生成器生成的诗歌的每一指标评分收敛,将更新后的预设诗歌生成器作为目标诗歌生成器;
根据若干个关键词和所述目标诗歌生成器,获取若干首目标诗歌。
2.根据权利要求1所述方法,其特征在于,所述评价指标包括:语句通顺性、语义丰富程度、上下文关联性和整体质量。
3.根据权利要求2所述方法,其特征在于,对于语句通顺性评价指标,利用语句通顺性评分器对每一首诗歌进行评分,对任一首诗歌,利用语句通顺性评分器对所述任一首诗歌进行评分具体为:
r(lj)=max(|Plm(lj)-u|-0.25*σ,0)
其中,o表示所述任一首诗歌,R1(o)表示所述任一首诗歌o的语句通顺性评分,m表示所述任一首诗歌o由m个句子组成,lj表示第j个句子,Plm(lj)表示诗句lj在语料库中出现的概率,μ表示Plm(lj)在所述语料库上的均值,σ表示Plm(lj)在所述语料库上的方差,r(lj)表示诗句lj的近似通顺性取值,所述预设诗歌生成器通过对语料库中的诗歌进行训练得到。
4.根据权利要求2所述方法,其特征在于,对于语义丰富程度指标,利用语义丰富程度评分器对每一首诗歌进行评分,对任一首诗歌,利用语义丰富程度评分器对所述任一首诗歌进行评分具体为:
其中,o表示所述任一首诗歌,R2(o)表示所述任一首诗歌o的语义丰富程度评分,m表示所述任一首诗歌o由m个句子组成,Tj为所述任一首诗歌o中第j个句子的词数,Ct表示第t个词,F(Ct)表示所述任一首诗歌o中第t个词的TF-IDF数值。
5.根据权利要求2所述方法,其特征在于,对于上下文关联性指标,利用上下文关联性评分器对每一首诗歌进行评分,对任一首诗歌,利用上下文关联性评分器对所述任一首诗歌进行评分具体为:
MI(l1:j-1,lj)=logPseq2seq(lj|l1:j-1)-γlogPlm(lj),
其中,o表示所述任一首诗歌,R3(o)表示所述任一首诗歌o的上下文关联性评分,m表示所述任一首诗歌o由m个句子组成,logPseq2seq(lj|l1:j-1)表示一个用来衡量上下文共现概率的神经网络序列到序列映射模型,γ表示一个预设的超参数,Plm(lj)表示诗句lj在语料库中出现的概率。
6.根据权利要求2所述方法,其特征在于,对于整体质量指标,利用整体质量评分器对每一首诗歌进行评分,对任一首诗歌,利用整体质量评分器对所述任一首诗歌进行评分具体为:
其中,o表示所述任一首诗歌,R4(o)表示所述任一首诗歌o的整体质量评分,Pcl(a|o)表示基于语料库构建的神经网络分类器,a的取值范围为1、2和3。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811392886.3/1.html,转载请声明来源钻瓜专利网。