[发明专利]一种图像识别的方法、图像识别模型的训练方法及装置在审
申请号: | 202010668385.4 | 申请日: | 2020-07-13 |
公开(公告)号: | CN111709398A | 公开(公告)日: | 2020-09-25 |
发明(设计)人: | 邓强 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20;G06K9/34;G06K9/46;G06K9/62;G06N20/00 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 李杭 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 识别 方法 模型 训练 装置 | ||
本申请公开了一种基于人工智能的图像识别方法,该方法包括:获取待识别图像;若所述待识别图像包括图片,则根据所述待识别图像获取图像特征向量;若所述待识别图像包括文本,则根据所述待识别图像获取文本特征向量;根据所述图像特征向量以及所述文本特征向量,获取所述待识别图像所对应的图像识别结果。本申请还公开了一种图像识别模型的训练方法及装置。本申请对图像进行识别的过程中,可将提取到图像特征向量以及文本特征向量共同作为预测图像类型的依据,最终得到图像识别结果,该图像识别结果属于综合图片和文本两个维度的特征,从而有助于得到准确率更高的图像识别结果。
技术领域
本申请涉及计算机视觉领域,尤其涉及一种图像识别的方法、图像识别模型的训练方法及装置。
背景技术
图像由于其直观且承载信息量较大等优势,常常会出现在各类媒体信息中,例如,对于资讯推荐类产品而言,会在文章中间穿插待识别图像,或者在文章开头部分出现待识别图像。这种情况下,会在一定程度下影响用户阅读文章的效率和体验。又例如,为了吸引流量,不法分子会生成或传播大量低俗等违规图像。
基于此,如何对海量的图像进行快速识别,保证图像识别结果的准确性是亟待解决的技术问题。目前,识别图像的方式通常为,从图像的原始特征出发,首先提取图像的图像特征,然后采用深度学习模型对图像特征进行识别,最后生成图像识别结果。
然而,图像中的信息是多样的,可能包括图片,也可能包括文本等,因此,仅通过图像的原始特征对图像进行识别,容易出现偏差,导致图像识别的准确率较低。
发明内容
本申请实施例提供了一种图像识别的方法、图像识别模型的训练方法及装置,在对图像进行识别的过程中,可将提取到图像特征向量以及文本特征向量共同作为预测图像类型的依据,最终得到图像识别结果,该图像识别结果属于综合图片和文本两个维度的特征,从而有助于得到准确率更高的图像识别结果。
有鉴于此,本申请的一方面提供一种图像识别的方法,包括:
获取待识别图像;
若待识别图像包括图片,则根据待识别图像获取图像特征向量,其中,图像特征向量包括基础特征向量,基础特征向量表示图片的尺寸信息;
若待识别图像包括文本,则根据待识别图像获取文本特征向量,其中,文本特征向量为根据文本的语义特征向量以及文本的位置特征向量确定的,图像特征向量还包括统计特性向量,统计特性向量表示文本的字符数量;
根据图像特征向量以及文本特征向量,获取待识别图像所对应的图像识别结果。
本申请另一方面提供一种图像识别模型的训练方法,包括:
获取待训练图像集合,其中,待训练图像集合包括至少一个待训练图像,且每个待训练图像对应于标签,标签用于表示待训练图像的类别;
基于待训练图像集合中的任意一个待训练图像,获取待训练图像所对应的图像特征向量,其中,图像特征向量包括基础特征向量以及统计特性向,基础特征向量表示待训练图像中图片的尺寸信息,统计特性向量表示待训练图像中文本的字符数量;
基于任意一个待训练图像,获取待训练图像所对应的文本特征向量,其中,文本特征向量为根据待训练图像中文本的语义特征向量以及待训练图像中文本的尺寸信息确定的;
基于任意一个待训练图像所对应的图像特征向量以及文本特征向量,通过待训练图像识别模型获取待训练图像所对应的类别概率分布;
根据至少一个待训练图像所对应的类别概率分布以及标签,对待训练图像识别模型的模型参数进行更新,直至达到模型收敛条件时,得到图像识别模型。
本申请另一方面提供一种待识别图像识别的方法,包括:
获取待处理文章,其中,待处理文章中包括待识别图像以及文章信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010668385.4/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序