[发明专利]验证码字符生成方法、装置、电子设备及存储介质在审
申请号: | 201910425674.9 | 申请日: | 2019-05-21 |
公开(公告)号: | CN110246197A | 公开(公告)日: | 2019-09-17 |
发明(设计)人: | 张兴盟 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | G06T11/00 | 分类号: | G06T11/00;G06F21/31;G06N3/04;G06N3/08;H04L9/32;H04L29/06 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字体 字符图像 向量 嵌入 预设 字符图像生成 验证码字符 存储介质 电子设备 目标字符 字符形体 字体库 映射关系 字体选择 拼接 指令 记录 | ||
本发明公开一种验证码字符生成方法、装置、电子设备及存储介质,该方法包括:接收第一字符图像,对第一字符图像进行编码,得到第一字符图像的字符嵌入向量,第一字符图像中包含字体为第一字体的目标字符,第一字体为已知字体;接收字体选择指令,从预设字体库中选择至少一个字体,生成所选择字体的字体嵌入向量,预设字体库中包括N个字体,N个字体均为已知字体;对第一字符图像的字符嵌入向量和所选择字体的字体嵌入向量进行拼接得到字符形体向量;根据字符形体向量和预设的字符图像生成模型,生成第二字符图像,第二字符图像中包含字体为第二字体的目标字符,第二字体为未知字体,字符图像生成模型中记录有已知字体与未知字体之间的映射关系。
技术领域
本发明涉及安全验证技术领域,特别涉及一种验证码字符生成方法、装置、电子设备及存储介质。
背景技术
随着互联网技术的发展,互联网公司提供的应用程序种类和功能越来越丰富,为人们的生活、工作和学习带来了很大便利。与此同时,也出现了一些黑灰产“薅羊毛”现象,黑灰产团伙通过机器方式恶意注册或登录应用程序的账号,以对互联网公司的资产进行窃取,给互联网公司带来了巨大损失。
为了阻止黑灰产“薅羊毛”,互联网公司会在操作者注册和登录应用程序账号时,对操作者的身份进行验证。由于选字验证码融入了文字逻辑知识,其安全性比其他验证码的安全性高很多,因此被很多互联网公司用来验证操作者的身份。
但是,随着OCR(Optical Character Recognition,光学字符识别)技术的出现,黑灰产团伙开始利用OCR对选字验证码进行破解,导致选字验证码的安全性较低。因此,如何在OCR技术广泛应用的情况下保证选字验证码的安全性已成为业内亟待解决的问题。
发明内容
本发明实施例提供了一种验证码字符生成方法、装置、电子设备及存储介质,以解决现有技术中存在的选字验证码的安全性较低的技术问题。
根据本发明的第一方面,公开了一种验证码字符生成方法,所述方法包括:
接收第一字符图像,对所述第一字符图像进行编码,得到所述第一字符图像的字符嵌入向量,其中,所述第一字符图像中包含字体为第一字体的目标字符,所述第一字体为已知字体;
接收字体选择指令,从预设字体库中选择至少一个字体,生成所选择字体的字体嵌入向量,其中,所述预设字体库中包括N个字体,所述N个字体均为已知字体;
对所述第一字符图像的字符嵌入向量和所选择字体的字体嵌入向量进行拼接,得到字符形体向量;
根据所述字符形体向量和预设的字符图像生成模型,生成第二字符图像,其中,所述第二字符图像中包含字体为第二字体的目标字符,所述第二字体为未知字体,所述字符图像生成模型中记录有已知字体与未知字体之间的映射关系,一个字符图像中包含一个字符。
可选地,作为一个实施例,在所述根据所述字符形体向量和预设的字符图像生成模型,生成第二字符图像的步骤之前,还包括:
训练字符图像生成模型,其中,所述字符图像生成模型的训练过程包括:
获取字符集,其中,所述字符集中包括M个不同字符;
按照所述预设字体库中的每个字体,将所述字符集中的每个字符绘制成对应的字符图像,得到训练样本集{P1,P2,…,PM*N},其中,M*N为所述训练样本集中字符图像的个数,Pi为所述训练样本集中的第i个字符图像,Pi中字符的字体为Qi;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910425674.9/2.html,转载请声明来源钻瓜专利网。