[发明专利]一种基于中医药知识图谱和注意力机制的中医典籍古文翻译方法有效
申请号: | 201910019916.4 | 申请日: | 2019-01-09 |
公开(公告)号: | CN109740168B | 公开(公告)日: | 2020-10-13 |
发明(设计)人: | 徐亨如;李思;徐雅静;高升 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06N3/04;G06N3/08;G06F16/36 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于中医药知识图谱和注意力机制的中医典籍古文翻译方法,属于信息处理领域。该方法的特征包括:基于注意力机制,用中医药知识图谱指导训练attention‑seq2seq中医典籍古文翻译模型。具体特征为:根据中医药知识图谱,将中医专业知识编码成图谱向量,用循环神经网络将中医古文编码得到古文向量;将古文向量作为另一个循环神经网络的初始参数,输入特定开始字符,开始解码;将上一时刻解码器的输出经过Attention模块得到attention向量,attention向量和图谱向量一起得到指导向量。指导向量和上一时刻的输出拼接作为下一时刻解码器的输入,直至解码器输出结束符。本发明通过中医药知识图谱引入了大量专业中医知识指导attention‑seq2seq模型,取得了很好的应用效果。 | ||
搜索关键词: | 一种 基于 中医药 知识 图谱 注意力 机制 中医 典籍 古文 翻译 方法 | ||
【主权项】:
1.一种基于中医药知识图谱和注意力机制的中医典籍古文翻译方法,其特征在于,所述方法包含以下结构和步骤:(1)基于中医药知识图谱,构造中医药实体词典和关系词典,并初始化实体向量和关系向量;(2)中医古文和现代汉语词语分别向量化,将词语转换为相应的词向量,将中医古文映射为一个中医古文矩阵;(3)对中医古文,基于中医药实体词典和中医药知识图谱,将其编码成图谱向量;(4)编码阶段,使用循环神经网络对中医古文进行语义信息编码,将步骤(2)得到的中医古文矩阵作为编码器的输入,编码成古文向量;(5)解码阶段,用步骤(4)得到的古文向量初始化用于解码的循环神经网络,使用特定的开始符,作为解码器第一时刻的输入,开始解码;(6)解码直至输出停止符,前一时刻解码器的输出经过attention结构得到attention向量,结合步骤(3)的图谱向量得到指导向量。列拼接指导向量和解码器上一时刻的输出得到下一时刻解码器的输入,解码直至输出停止符。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910019916.4/,转载请声明来源钻瓜专利网。