[发明专利]一种基于词典和seq2seq预训练机制的中医古籍翻译方法有效

申请号：	201910020459.0	申请日：	2019-01-09
公开（公告）号：	CN109740169B	公开（公告）日：	2020-10-13
发明（设计）人：	高升;徐亨如;李思;徐雅静	申请（专利权）人：	北京邮电大学
主分类号：	G06F40/129	分类号：	G06F40/129;G06F40/242;G06N3/04
代理公司：	暂无信息	代理人：	暂无信息
地址：	100876 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于词典和seq2seq预训练机制的中医典籍古文翻译方法，属于信息处理领域。该方法的特征包括：先预训练一个通用的seq2seq古文翻译模型，再基于词典，在中医专业知识的指导下，训练针对中医典籍的古文翻译模型。具体特征为：编码器和中医专业知识编码器分别用循环神经网络将古文编码得到内容向量，中医专业知识编码得到专业向量；将内容向量作为另一个循环神经网络的初始参数，输入特定开始字符，开始解码；将上一时刻解码器的输出、内容向量、专业向量拼接作为下一时刻解码器的输入，直至解码器输出结束符。本发明通过预训练通用的seq2seq古文翻译模型，并基于词典，在中医专业知识的指导下对中医典籍古文翻译进行优化，取得了很好的应用效果。
搜索关键词：	一种基于词典 seq2seq 训练机制中医古籍翻译方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于词典和seq2seq预训练机制的中医古籍翻译方法，其特征在于，所述方法包含以下结构和步骤：第一部分，训练通用的seq2seq古文翻译模型，(1.1)古文和现代汉语词语分别向量化，分别建立古文和现代汉语的词典，对输入文本的词语进行映射，将词语转换为相应的词向量；(1.2)对步骤(1.1)得到的古文各词语词向量进行列拼接，得到编码器输入；(1.3)编码阶段，使用循环神经网络对古文进行语义信息编码，将步骤(1.2)得到的向量作为编码器的输入，编码成一个定长的语义向量context；(1.4)解码阶段，用步骤(1.3)得到的context向量初始化用于解码的循环神经网络，使用特定的开始符，作为解码器第一时刻的输入，开始解码；(1.5)解码直至输出停止符，列拼接步骤(1.3)得到的语义向量context和上一时刻解码器的输出，得到下一时刻的解码器输入，输入至解码器，将解码器输出经过前向神经网络得到翻译结果，解码直至解码器输出停止符,解码结束。第二部分，基于中医字典，在中医专业知识指导下，训练针对中医典籍的古文翻译模型，(2.1)由第一部分得到的古文词表和现代汉语词表，将中医典籍的古文和现代汉语映射成词向量；(2.2)对步骤(2.1)得到的古文的文本矩阵进行列拼接，得到编码器输入，对于中医古文的专有名词，由《中医名词词典》，得到现代汉语专业解释，并根据已有的现代汉语词表，将现代汉语专业解释映射成词向量。(2.3)重载第一部分训练得到的模型，加入中医专业知识编码结构，得到中医专业知识编码向量，并按第一部分的步骤二‑步骤五进行训练，和第一部分不同的是，步骤三得到的定长向量先和中医专业知识编码向量列连接，再经过一个前向神经网络，得到指导向量，解码阶段的输入由上一个时刻解码器的输出和指导向量列拼接得到。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京邮电大学，未经北京邮电大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910020459.0/，转载请声明来源钻瓜专利网。

上一篇：一种基于中医药知识图谱和注意力机制的中医典籍古文翻译方法
下一篇：一种互动式智能会议系统

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于词典和seq2seq预训练机制的中医古籍翻译方法有效

专利文献下载