[发明专利]基于LSTM模型的现代文到古诗的转换方法及装置在审
申请号: | 201611140395.0 | 申请日: | 2016-12-12 |
公开(公告)号: | CN106598921A | 公开(公告)日: | 2017-04-26 |
发明(设计)人: | 王东;白紫薇;冯洋;杜新凯;游世学 | 申请(专利权)人: | 清华大学;北京中科汇联科技股份有限公司 |
主分类号: | G06F17/22 | 分类号: | G06F17/22 |
代理公司: | 北京庆峰财智知识产权代理事务所(普通合伙)11417 | 代理人: | 李文军 |
地址: | 10008*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 lstm 模型 现代文 古诗 转换 方法 装置 | ||
1.基于LSTM模型的现代文到古诗的转换方法,其特征在于:所述的LSTM模型包括用于将用户的输入词序列转化为一个激活状态的编码部件和根据激活状态调节目标序列的生成的解码部件;编码部件和解码部件都是通过LSTM实现。
2.根据权利要求1所述的基于LSTM模型的现代文到古诗的转换方法,其特征在于:所述的编码部件使用了双向LSTM模型,前向的LSTM模型按照信息输入的顺序读取输入序列(),并计算出前向隐层状态(),后向的LSTM模型按与信息输入相反的顺序读取序列(),并计算后向隐层状态(),将前向和后向状态连接在一起得到每个词的解释向量。
3.根据权利要求1所述的基于LSTM模型的现代文到古诗的转换方法,其特征在于:所述的解码部件中,在decoder层中,定义条件概率为:
,
是LSTM是i时刻的隐层状态,
为每个单词的直接上下文向量,表示生成过程中的外部输入信息,
,
权重为:
,
其中:。
4.根据权利要求1所述的基于LSTM模型的现代文到古诗的转换方法,其特征在于:生成过程中,后一句的生成结果依赖前一句生成的词。
5.根据权利要求1所述的基于LSTM模型的现代文到古诗的转换方法,其特征在于:所述的LSTM模型依赖一个文体规则约束。
6.根据权利要求1所述的基于LSTM模型的现代文到古诗的转换方法,其特征在于:所述的LSTM模型的训练方法为:将解码部件得到的向量输入一个softmax回归层,得到可能结果的概率分布,选择softmax得到的实际概率分布与期望输出的交叉熵作为损失函数,损失函数为:
,
y为期望输出,a为实际输出,w为单词,s为句子,n为批大小。
7.根据权利要求6所述的基于LSTM模型的现代文到古诗的转换方法,其特征在于:采用最小批随机梯度下降算法作为优化算法:
C’是损失函数的导数;
并使用AdaDelta算法调整学习速率。
8.实现如权利要求1-7中任意一项所述的基于LSTM模型的现代文到古诗的转换方法的装置,其特征在于:包括用于将用户的输入词序列转化为一个激活状态的编码模块和根据激活状态调节目标序列的生成的解码模块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学;北京中科汇联科技股份有限公司,未经清华大学;北京中科汇联科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611140395.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种笔画编码结合汉字点阵的形近字分类方法
- 下一篇:一种字符串转换方法及系统