[发明专利]一种自动生成诗歌的方法及系统在审

申请号：	201811392886.3	申请日：	2018-11-21
公开（公告）号：	CN111291536A	公开（公告）日：	2020-06-16
发明（设计）人：	孙茂松;矣晓沅;李若愚;李文浩	申请（专利权）人：	清华大学
主分类号：	G06F40/166	分类号：	G06F40/166;G06F40/211;G06F40/30;G06Q10/06
代理公司：	北京路浩知识产权代理有限公司 11002	代理人：	王莹;吴欢燕
地址：	100084 北京市海***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种自动生成诗歌方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种自动生成诗歌的方法，其特征在于，包括：

根据若干个关键词和预设诗歌生成器，获取若干首诗歌；

利用每一评分器对每一首诗歌进行评价，获取每一首诗歌的每一指标评分，每一评分器根据目标诗歌的每一评价指标构建；

根据每一首诗歌的每一指标评分，获取每一首诗歌的综合评分；

根据每一首诗歌的综合评分，对所述预设诗歌生成器的参数进行优化，直到更新后的预设诗歌生成器生成的诗歌的每一指标评分收敛，将更新后的预设诗歌生成器作为目标诗歌生成器；

根据若干个关键词和所述目标诗歌生成器，获取若干首目标诗歌。

2.根据权利要求1所述方法，其特征在于，所述评价指标包括：语句通顺性、语义丰富程度、上下文关联性和整体质量。

3.根据权利要求2所述方法，其特征在于，对于语句通顺性评价指标，利用语句通顺性评分器对每一首诗歌进行评分，对任一首诗歌，利用语句通顺性评分器对所述任一首诗歌进行评分具体为：

r(l_j)＝max(|P_lm(l_j)-u|-0.25*σ,0)

其中，o表示所述任一首诗歌，R₁(o)表示所述任一首诗歌o的语句通顺性评分，m表示所述任一首诗歌o由m个句子组成，l_j表示第j个句子，P_lm(l_j)表示诗句l_j在语料库中出现的概率，μ表示P_lm(l_j)在所述语料库上的均值，σ表示P_lm(l_j)在所述语料库上的方差，r(l_j)表示诗句l_j的近似通顺性取值，所述预设诗歌生成器通过对语料库中的诗歌进行训练得到。

4.根据权利要求2所述方法，其特征在于，对于语义丰富程度指标，利用语义丰富程度评分器对每一首诗歌进行评分，对任一首诗歌，利用语义丰富程度评分器对所述任一首诗歌进行评分具体为：

其中，o表示所述任一首诗歌，R₂(o)表示所述任一首诗歌o的语义丰富程度评分，m表示所述任一首诗歌o由m个句子组成，T_j为所述任一首诗歌o中第j个句子的词数，C_t表示第t个词，F(C_t)表示所述任一首诗歌o中第t个词的TF-IDF数值。

5.根据权利要求2所述方法，其特征在于，对于上下文关联性指标，利用上下文关联性评分器对每一首诗歌进行评分，对任一首诗歌，利用上下文关联性评分器对所述任一首诗歌进行评分具体为：

MI(l_1:j-1,l_j)＝logP_seq2seq(l_j|l_1:j-1)-γlogP_lm(l_j)，

其中，o表示所述任一首诗歌，R₃(o)表示所述任一首诗歌o的上下文关联性评分，m表示所述任一首诗歌o由m个句子组成，logP_seq2seq(l_j|l_1:j-1)表示一个用来衡量上下文共现概率的神经网络序列到序列映射模型，γ表示一个预设的超参数，P_lm(l_j)表示诗句l_j在语料库中出现的概率。

6.根据权利要求2所述方法，其特征在于，对于整体质量指标，利用整体质量评分器对每一首诗歌进行评分，对任一首诗歌，利用整体质量评分器对所述任一首诗歌进行评分具体为：

其中，o表示所述任一首诗歌，R₄(o)表示所述任一首诗歌o的整体质量评分，P_cl(a|o)表示基于语料库构建的神经网络分类器，a的取值范围为1、2和3。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于清华大学，未经清华大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201811392886.3/1.html，转载请声明来源钻瓜专利网。

上一篇：制冰装置及其控制方法、冰箱
下一篇：超参数优化过程中的资源调度方法、装置、设备及介质

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种自动生成诗歌的方法及系统在审

专利文献下载