[发明专利]基于LSTM模型的现代文到古诗的转换方法及装置在审

申请号：	201611140395.0	申请日：	2016-12-12
公开（公告）号：	CN106598921A	公开（公告）日：	2017-04-26
发明（设计）人：	王东;白紫薇;冯洋;杜新凯;游世学	申请（专利权）人：	清华大学;北京中科汇联科技股份有限公司
主分类号：	G06F17/22	分类号：	G06F17/22
代理公司：	北京庆峰财智知识产权代理事务所(普通合伙)11417	代理人：	李文军
地址：	10008***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于 lstm 模型现代文古诗转换方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.基于LSTM模型的现代文到古诗的转换方法，其特征在于：所述的LSTM模型包括用于将用户的输入词序列转化为一个激活状态的编码部件和根据激活状态调节目标序列的生成的解码部件；编码部件和解码部件都是通过LSTM实现。

2.根据权利要求1所述的基于LSTM模型的现代文到古诗的转换方法，其特征在于：所述的编码部件使用了双向LSTM模型，前向的LSTM模型按照信息输入的顺序读取输入序列（），并计算出前向隐层状态（），后向的LSTM模型按与信息输入相反的顺序读取序列（），并计算后向隐层状态（），将前向和后向状态连接在一起得到每个词的解释向量。

3.根据权利要求1所述的基于LSTM模型的现代文到古诗的转换方法，其特征在于：所述的解码部件中，在decoder层中，定义条件概率为：

，

是LSTM是i时刻的隐层状态，

为每个单词的直接上下文向量，表示生成过程中的外部输入信息，

，

权重为：

，

其中：。

4.根据权利要求1所述的基于LSTM模型的现代文到古诗的转换方法，其特征在于：生成过程中，后一句的生成结果依赖前一句生成的词。

5.根据权利要求1所述的基于LSTM模型的现代文到古诗的转换方法，其特征在于：所述的LSTM模型依赖一个文体规则约束。

6.根据权利要求1所述的基于LSTM模型的现代文到古诗的转换方法，其特征在于：所述的LSTM模型的训练方法为：将解码部件得到的向量输入一个softmax回归层，得到可能结果的概率分布，选择softmax得到的实际概率分布与期望输出的交叉熵作为损失函数，损失函数为：

，