[发明专利]验证码字符生成方法、装置、电子设备及存储介质在审
申请号: | 201910425674.9 | 申请日: | 2019-05-21 |
公开(公告)号: | CN110246197A | 公开(公告)日: | 2019-09-17 |
发明(设计)人: | 张兴盟 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | G06T11/00 | 分类号: | G06T11/00;G06F21/31;G06N3/04;G06N3/08;H04L9/32;H04L29/06 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字体 字符图像 向量 嵌入 预设 字符图像生成 验证码字符 存储介质 电子设备 目标字符 字符形体 字体库 映射关系 字体选择 拼接 指令 记录 | ||
1.一种验证码字符生成方法,其特征在于,所述方法包括:
接收第一字符图像,对所述第一字符图像进行编码,得到所述第一字符图像的字符嵌入向量,其中,所述第一字符图像中包含字体为第一字体的目标字符,所述第一字体为已知字体;
接收字体选择指令,从预设字体库中选择至少一个字体,生成所选择字体的字体嵌入向量,其中,所述预设字体库中包括N个字体,所述N个字体均为已知字体;
对所述第一字符图像的字符嵌入向量和所选择字体的字体嵌入向量进行拼接,得到字符形体向量;
根据所述字符形体向量和预设的字符图像生成模型,生成第二字符图像,其中,所述第二字符图像中包含字体为第二字体的目标字符,所述第二字体为未知字体,所述字符图像生成模型中记录有已知字体与未知字体之间的映射关系,一个字符图像中包含一个字符。
2.根据权利要求1所述的方法,其特征在于,在所述根据所述字符形体向量和预设的字符图像生成模型,生成第二字符图像的步骤之前,还包括:
训练字符图像生成模型,其中,所述字符图像生成模型的训练过程包括:
获取字符集,其中,所述字符集中包括M个不同字符;
按照所述预设字体库中的每个字体,将所述字符集中的每个字符绘制成对应的字符图像,得到训练样本集{P1,P2,…,PM*N},其中,M*N为所述训练样本集中字符图像的个数,Pi为所述训练样本集中的第i个字符图像,Pi中字符的字体为Qi;
针对每个字符图像Pi,对Pi进行编码得到Pi的字符嵌入向量,生成Qi的字体嵌入向量,对Pi的字符嵌入向量和Qi的字体嵌入向量进行拼接得到Pi的字符形体向量;
通过生成式对抗网络GAN算法,对所有Pi的字符形体向量进行训练,得到字符图像生成模型。
3.根据权利要求2所述的方法,其特征在于,所述字体嵌入向量为N维列向量或N维行向量,一个字体嵌入向量中包括:一个1和N-1个0。
4.根据权利要求3所述的方法,其特征在于,所述从预设字体库中选择至少一个字体,生成所选择字体的字体嵌入向量,包括:
从预设字体库中选择一个字体,生成一个字体嵌入向量;
所述对所述第一字符图像的字符嵌入向量和所选择字体的字体嵌入向量进行拼接,得到字符形体向量,包括:
对所述第一字符图像的字符嵌入向量和所生成的一个字体嵌入向量进行拼接,得到字符形体向量。
5.根据权利要求3所述的方法,其特征在于,所述从预设字体库中选择至少一个字体,生成所选择字体的字体嵌入向量,包括:
从预设字体库中选择多个字体,生成多个字体嵌入向量,其中,一个字体对应一个字体嵌入向量;
所述对所述第一字符图像的字符嵌入向量和所选择字体的字体嵌入向量进行拼接,得到字符形体向量,包括:
对所述多个字体嵌入向量进行加权求和,得到插值字体嵌入向量;
对所述第一字符图像的字符嵌入向量和所述插值字体嵌入向量进行拼接,得到字符形体向量。
6.根据权利要求1所述的方法,其特征在于,所述第一字体与所述字体选择指令指示选择的字体为同一字体,或者为不同字体。
7.根据权利要求1至6任一项所述的方法,其特征在于,所述字符包括下述任一种:汉字、数字和字母。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910425674.9/1.html,转载请声明来源钻瓜专利网。