[发明专利]图片类别的识别方法、装置、电子设备及存储设备在审
申请号: | 202010182478.6 | 申请日: | 2020-03-16 |
公开(公告)号: | CN113408553A | 公开(公告)日: | 2021-09-17 |
发明(设计)人: | 高飞宇;王永攀 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/00;G06F16/55;G06F16/36 |
代理公司: | 北京清源汇知识产权代理事务所(特殊普通合伙) 11644 | 代理人: | 张艳梅;冯德魁 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图片 类别 识别 方法 装置 电子设备 存储 设备 | ||
1.一种图片类别的识别方法,其特征在于,包括:
获得目标图片;
根据所述目标图片得到含有坐标信息和文字内容的文本块;
根据所述文本块生成图结构;
根据所述图结构得到图结构的向量特征信息;
将所述向量特征信息输入向量分类模型,得到所述目标图片的类别;所述向量分类模型用于根据输入的向量特征信息获得向量特征信息所对应的图片的类别。
2.根据权利要求1所述的方法,其特征在于,所述根据所述图结构得到图结构的向量特征信息,包括:
根据所述图结构得到图结构的文本块特征信息;
将所述图结构的文本块特征信息转换为向量特征信息。
3.根据权利要求1所述的方法,其特征在于,所述根据所述文本块生成图结构,包括:
将所述文本块中的文字内容转化为节点的向量特征信息作为所述文本块对应的图结构的节点的特征信息;
将两个文本块之间的相对位置信息和相对宽高信息作为两个文本块对应的节点之间的边的特征信息;
根据所述节点的特征信息和节点之间的边的特征信息生成图结构。
4.根据权利要求3所述的方法,其特征在于,所述将两个文本块之间的相对位置信息和相对宽高信息作为两个文本块对应的节点之间的边的特征信息,包括:
根据两个节点对应的文本块的坐标信息,得到与文本块对应的两个矩形;
对两个矩形的宽和高进行归一化处理,得到归一化处理后的两个矩形;
将两个矩形对应顶点之间的相对位置信息和归一化处理后的矩形的宽度信息和高度信息作为两个文本块对应的节点之间的边的特征信息。
5.根据权利要求3或4所述的方法,其特征在于,所述根据所述图结构得到图结构的文本块特征信息,包括:
将图结构中每个节点的特征信息和图结构包含的所有边的特征信息进行合并处理,作为图结构的文本块特征信息。
6.根据权利要求3所述的方法,其特征在于,所述根据所述节点的特征信息和节点之间的边的特征信息生成图结构,包括:
根据所述节点的特征信息和节点之间的边的特征信息生成全连接有向图。
7.根据权利要求1所述的方法,其特征在于,所述将所述向量特征信息输入向量分类模型,得到所述目标图片的类别,包括:
将所述向量特征信息输入向量分类模型,向量分类模型输出向量特征信息属于每一类别的概率值;
根据向量特征信息属于每一类别的概率值,得到所述向量特征信息对应的类别;
将所述向量特征信息对应的类别作为所述目标图片的类别。
8.根据权利要求7所述的方法,其特征在于,所述根据向量特征信息属于每一类别的概率值,得到所述向量特征信息对应的类别,包括:
从所述向量特征信息属于每一类别的概率值中选取最大的概率值;
判断所述最大的概率值是否大于或等于预设的概率阈值;
若是,将所述最大的概率值对应的图片类别作为所述向量特征信息对应的类别。
9.根据权利要求1所述的方法,其特征在于,所述目标图片为包含文字信息的文档图片。
10.一种图片类别的识别装置,其特征在于,包括:
目标图片获得单元,用于获得目标图片;
文本块得到单元,用于根据所述目标图片得到含有坐标信息和文字内容的文本块;
图结构生成单元,用于根据所述文本块生成图结构;
向量特征信息得到单元,用于根据所述图结构得到图结构的向量特征信息;
目标图片的类别得到单元,用于将所述向量特征信息输入向量分类模型,得到所述目标图片的类别;所述向量分类模型用于根据输入的向量特征信息获得向量特征信息所对应的图片的类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010182478.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:生成文本摘要的方法和装置
- 下一篇:一种OLED器件结构、显示面板及显示装置