[发明专利]汉字拼音转换方法、装置、电子设备及存储介质有效
申请号: | 202010860189.7 | 申请日: | 2020-08-25 |
公开(公告)号: | CN111737957B | 公开(公告)日: | 2021-06-01 |
发明(设计)人: | 李成飞;杨嵩;王桑 | 申请(专利权)人: | 北京世纪好未来教育科技有限公司 |
主分类号: | G06F40/126 | 分类号: | G06F40/126;G06F40/263;G06N3/04;G06N3/08;G10L13/02 |
代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 阎敏;杨瑾瑾 |
地址: | 100086 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 汉字 拼音 转换 方法 装置 电子设备 存储 介质 | ||
1.一种汉字拼音转换方法,其特征在于,包括:
将汉字序列划分为多个汉字,确定各个所述汉字的编码向量;
分别将各个汉字的编码向量输入汉字转拼音模型的各级网络,所述汉字转拼音模型的各级网络的输出结果被配置为第一网络模块的第一输入内容;其中,所述汉字转拼音模型采用基于长短时记忆网络的网络架构;
分别将各个汉字的前一个汉字对应的拼音的编码向量输入拼音语言模型的各级网络,所述拼音语言模型的各级网络的输出结果被配置为第一网络模块的第二输入内容;其中,所述拼音语言模型采用基于长短时记忆网络的网络架构,并采用拼音级的数学序列模型;
所述第一网络模块被配置为根据所述第一输入内容和第二输入内容,确定各个汉字对应的拼音的编码向量;
根据所述各个汉字对应的拼音的编码向量,确定所述汉字序列对应的拼音序列。
2.根据权利要求1所述的方法,其特征在于,所述分别将各个汉字的前一个汉字对应的拼音的编码向量输入拼音语言模型的各级网络,包括:
所述汉字为汉字序列中的第一个汉字时,将所述汉字序列的起始标签对应的编码向量输入拼音语言模型的第一级网络;
所述汉字为汉字序列中的第N个汉字时,将第N-1个汉字对应的拼音的编码向量输入拼音语言模型的N级网络;其中,所述N为大于或等于2的整数,所述第N-1个汉字对应的拼音的编码向量为所述第一网络模块确定出的结果。
3.根据权利要求1或2所述的方法,其特征在于,
所述汉字转拼音模型的第一级网络的输入内容还包括初始化的隐层状态向量;
所述汉字转拼音模型的第N级网络的输入内容还包括第N-1级网络计算得到的隐层状态向量;其中,所述N为大于或等于2的整数;
所述汉字转拼音模型的各级网络还根据输入的隐层状态向量及所述汉字的编码向量,计算本级网络对应的隐层状态向量。
4.根据权利要求1或2所述的方法,其特征在于,
所述拼音语言模型的第一级网络的输入内容还包括初始化的隐层状态向量;
所述拼音语言模型的第N级网络的输入内容还包括第N-1级网络计算得到的隐层状态向量;其中,所述N为大于或等于2的整数;
所述拼音语言模型的各级网络还根据输入的隐层状态向量及所述前一个汉字对应的拼音的编码向量,计算本级网络对应的隐层状态向量。
5.一种汉字拼音转换模型的训练方法,其特征在于,所述汉字拼音转换模型包含汉字转拼音模型和拼音语言模型,所述训练方法包括:
将汉字样本序列划分为多个汉字,确定各个所述汉字的编码向量;并获取所述汉字样本序列对应的真实拼音序列,将所述真实拼音序列划分为各个所述汉字对应的真实拼音,得到各个真实拼音的编码向量;
分别将各个汉字的编码向量输入汉字转拼音模型的各级网络,所述汉字转拼音模型的各级网络的输出结果被配置为第一网络模块的第一输入内容;其中,所述汉字转拼音模型采用基于长短时记忆网络的网络架构;
分别将各个汉字的前一个汉字对应的真实拼音的编码向量输入拼音语言模型的各级网络,所述拼音语言模型的各级网络的输出结果被配置为第一网络模块的第二输入内容;其中,所述拼音语言模型采用基于长短时记忆网络的网络架构,并采用拼音级的数学序列模型;
所述第一网络模块被配置为根据所述第一输入内容和第二输入内容,确定各个汉字对应的预测拼音的编码向量;
根据所述各个汉字对应的预测拼音的编码向量和真实拼音的编码向量,对所述汉字转拼音模型和拼音语言模型进行优化。
6.根据权利要求5所述的方法,其特征在于,所述分别将各个汉字的前一个汉字对应的真实拼音的编码向量输入拼音语言模型的各级网络,包括:
所述汉字为汉字序列中的第一个汉字时,将所述汉字序列的起始标签对应的编码向量输入拼音语言模型的第一级网络;
所述汉字为汉字序列中的第N个汉字时,将第N-1个汉字对应的真实拼音的编码向量输入拼音语言模型的N级网络;其中,所述N为大于或等于2的整数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京世纪好未来教育科技有限公司,未经北京世纪好未来教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010860189.7/1.html,转载请声明来源钻瓜专利网。