[发明专利]图片识别方法、介质、装置和计算设备在审
申请号: | 202111182606.8 | 申请日: | 2021-10-11 |
公开(公告)号: | CN113902922A | 公开(公告)日: | 2022-01-07 |
发明(设计)人: | 刘稳军;胡宜峰;李唐薇;李雨珂;杨卫强;朱浩齐 | 申请(专利权)人: | 杭州网易智企科技有限公司 |
主分类号: | G06V10/40 | 分类号: | G06V10/40;G06V10/774;G06V10/764;G06N3/04;G06N3/08 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 申亚辉 |
地址: | 310052 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图片 识别 方法 介质 装置 计算 设备 | ||
本公开的实施方式提供了一种图片识别方法、介质、装置和计算设备。基于卷积神经网络从待识别图片中提取若干第一类特征图矩阵,并根据各个第一类特征图矩阵确定第一特征向量;将第一特征向量映射成第一概率表征值;若第一概率表征值大于第一预设阈值,则将第一特征向量映射成区域位置坐标,该区域位置坐标用于确定相应的预测区域,所述预测区域对应于所述第一类特征图矩阵中所可能包含的预设类型元素;从每个第一类特征图矩阵中裁剪出相应的预测区域,作为第二类特征图矩阵,并根据各个第二类特征图矩阵确定第二特征向量;将第二特征向量映射成第二概率表征值并输出。
技术领域
本公开的实施方式涉及信息技术领域,更具体地,本公开的实施方式涉及一种图片识别方法、介质、装置和计算设备。
背景技术
在有些业务中,需要识别图片是否为预设类型图片。预设类型图片是指包含预设类型元素的图片,可以根据实际业务需要设置预设类型元素。例如,可以设置预设类型元素为违禁元素(色情、暴恐、政治等),包含违禁元素的图片即是违禁图片。
为此,需要一种图片识别方法,以便能够比较准确地识别出预设类型图片。
发明内容
本公开提供一种图片识别方法、介质、装置和计算设备,以便能够比较准确地识别出预设类型图片。
在本公开实施方式的第一方面中,提供了一种图片识别方法,应用于识别模型,所述方法包括:
基于卷积神经网络从待识别图片的图片表示矩阵中提取至少一个第一类特征图矩阵,并根据各个第一类特征图矩阵确定第一特征向量;
将所述第一特征向量映射成第一概率表征值,用于表征首次识别出的所述待识别图片属于预设类型的概率;
若所述第一概率表征值大于第一预设阈值,则将所述第一特征向量映射成区域位置坐标,该区域位置坐标用于确定相应的预测区域,所述预测区域对应于所述第一类特征图矩阵中所可能包含的预设类型元素;
从每个第一类特征图矩阵中裁剪出相应的预测区域,作为第二类特征图矩阵,并根据各个第二类特征图矩阵确定第二特征向量;
将所述第二特征向量映射成第二概率表征值并输出,用于表征再次识别出的所述待识别图片属于预设类型的概率。
在本公开的一个实施方式中,根据各个第一类特征图矩阵确定第一特征向量,包括:
对各个第一类特征图矩阵分别进行池化操作,将各个池化操作结果值组成第一特征向量。
在本公开的另一实施方式中,根据各个第二类特征图矩阵确定第二特征向量,包括:
对各个第二类特征图矩阵分别进行池化操作,将各个池化操作结果值组成第二特征向量。
在本公开的又一个实施方式中,所述区域位置坐标包括用于划定所述预测区域的面积范围的坐标值集合。
在本公开的再一个实施方式中,根据所述区域位置坐标,从每个第一类特征图矩阵中裁剪出相应预测区域,包括:
若所述坐标值集合包括的任一坐标值为非整数,则将该坐标值调整成与该非整数最接近的整数;其中,调整后的所述坐标值集合划定的所述面积范围覆盖调整前的所述坐标值集合划定的所述面积范围;
根据调整后的所述坐标值集合,从每个第一类特征图矩阵中裁剪出相应的预测区域。
在本公开的再一个实施方式中,用于映射得到第一概率表征值的映射参数集与用于映射得到第二概率表征值的映射参数集,是同一参数集。
在本公开的再一个实施方式中,还包括:
若所述第一概率表征值不大于第一预设阈值,则输出所述第一概率表征值。
在本公开的再一个实施方式中,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州网易智企科技有限公司,未经杭州网易智企科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111182606.8/2.html,转载请声明来源钻瓜专利网。