[发明专利]一种中文深度学习输入法、装置及电子设备有效
申请号: | 201910572626.2 | 申请日: | 2019-06-27 |
公开(公告)号: | CN110286778B | 公开(公告)日: | 2023-08-15 |
发明(设计)人: | 王晨光 | 申请(专利权)人: | 北京金山安全软件有限公司 |
主分类号: | G06F3/023 | 分类号: | G06F3/023;G06N3/0464;G06N3/044;G06F40/30 |
代理公司: | 北京市广友专利事务所有限责任公司 11237 | 代理人: | 祁献民 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 中文 深度 学习 输入法 装置 电子设备 | ||
本发明的实施例公开一种中文深度学习输入法、装置及电子设备,涉及输入法领域,为用户提供更加准确的结果而发明。所述方法,包括:将当前输入的拼音序列,转化为整数编码;将所述整数编码经过嵌入层处理,得到初始编码矩阵;所述拼音序列中的每个字的拼音,对应所述初始编码矩阵中的一行向量;将所述初始编码矩阵经过卷积网络处理后得到第一向量;将第一向量作为第一门控循环单元网络的输入,经过深度学习得到语义编码向量;将所述语义编码向量,以及第二门控循环单元网络在上一时刻的输出,作为第二门控循环单元网络当前时刻的输入,经过深度学习后经过输出层输出预测结果。所述装置及电子设备包括用于执行所述方法的模块。本发明适用于基于拼音得到汉字。
技术领域
本发明涉及输入法领域,尤其涉及一种中文深度学习输入法、装置、电子设备、计算机可读存储介质及应用程序。
背景技术
随着计算机通信以及互联网技术的不断发展,电子设备,例如,智能移动电话、个人数字助理、掌上电脑、笔记本电脑等应用越来越普及,人们在利用电子设备过程中,实现交互的方式很多,其中一种方式是为用户提供键盘,用户在键盘上输入拼音字符串,将其转化为对应的汉字输出。当用户按长句或者短句的方式输入拼音串,现有的在中文输入法,采用枚举的方式将可能的字或词组成句子,然后用语言模型对候选句子进行打分排序,当用户输入的拼音串越长,对应的汉字越多,使得输出的句子前、后语义不连贯,最终导致为用户提供的结果不准确。
发明内容
有鉴于此,本发明实施例提供一种中文深度学习输入法、装置、电子设备、计算机可读存储介质及应用程序,能够为用户提供更加准确的结果。
第一方面,本发明实施例提供一种中文深度学习输入法,包括:将当前输入的拼音序列,转化为整数编码;将所述整数编码经过嵌入层处理,得到初始编码矩阵;所述拼音序列中的每个字的拼音,对应所述初始编码矩阵中的一行向量;将所述初始编码矩阵经过卷积网络处理后得到第一向量;将第一向量作为第一门控循环单元网络的输入,经过深度学习得到语义编码向量;将所述语义编码向量,以及第二门控循环单元网络在上一时刻的输出,作为第二门控循环单元网络当前时刻的输入,经过深度学习后经过输出层输出预测结果。
根据本发明实施例的一种具体实现方式,所述将所述初始编码矩阵经过卷积网络处理后得到第一向量,包括:将所述初始编码矩阵经过卷积层处理,得到第一中间向量;将所述第一中间向量经过池化层处理,得到第二中间向量;第二中间向量的维数低于第一中间向量的维数;将所述第二中间向量进行扁平化处理,得到一维的所述第一向量。
根据本发明实施例的一种具体实现方式,在将第一向量输入第一门控循环单元网络,所述方法还包括:将所述第一向量,以及所述初始编码矩阵,作为残差函数的输入,进行残差处理;将所述残差函数的输出,作为所述第一门控循环单元网络的输入。
根据本发明实施例的一种具体实现方式,在将所述残差函数的输出,输入所述第一门控循环单元网络,所述方法还包括:在将残差函数的输出,输入高速路网络层,将高速路网络层的输出作为所述第一门控循环单元网络的输入。
根据本发明实施例的一种具体实现方式,所述将所述语义编码向量,以及第二门控循环单元网络在上一时刻的输出,作为第二门控循环单元网络当前时刻的输入,经过深度学习后经过输出层输出预测结果,包括:将所述语义编码向量经过注意力机制处理,得到含有注意力权重的语义编码向量;将所述含有注意力权重的语义编码向量,以及第二门控循环单元网络在上一时刻的输出,作为第二门控循环单元网络当前时刻的输入,经过深度学习后经过归一化指数函数输出预测结果。
第二方面,本发明实施例提供一种中文深度学习输入装置,包括:转化模块,初始编码矩阵得到模块,第一向量得到模块,语义编码向量得到模块,预测模块,其中,
转化模块,用于将当前输入的拼音序列,转化为整数编码;
初始编码矩阵得到模块,用于将所述整数编码经过嵌入层处理,得到初始编码矩阵;所述拼音序列中的每个字的拼音,对应所述初始编码矩阵中的一行向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金山安全软件有限公司,未经北京金山安全软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910572626.2/2.html,转载请声明来源钻瓜专利网。