[发明专利]一种基于神经网络的PPT边框识别方法及相关设备有效
申请号: | 201910562994.9 | 申请日: | 2019-06-26 |
公开(公告)号: | CN110427820B | 公开(公告)日: | 2022-11-29 |
发明(设计)人: | 管明雷;汪驰升 | 申请(专利权)人: | 深圳职业技术学院 |
主分类号: | G06V30/414 | 分类号: | G06V30/414;G06V30/18;G06V30/19;G06V10/82;G06N3/04;G06N3/08;G06T3/40;G06T7/12 |
代理公司: | 深圳市君胜知识产权代理事务所(普通合伙) 44268 | 代理人: | 王永文;刘文求 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 神经网络 ppt 边框 识别 方法 相关 设备 | ||
1.一种基于神经网络的PPT边框识别方法,其特征在于,所述神经网络包括:特征提取层、轮廓分割层和角点定位层:
所述PPT边框识别方法包括:
将含有PPT文档信息的图片输入所述特征提取层中进行特征提取,得到所述特征提取层输出的图片的特征图;
将所述图片的特征图输入所述轮廓分割层,得到所述轮廓分割层输出的轮廓分割图像;
将所述轮廓分割图像输入所述角点定位层,得到所述角点定位层输出的PPT边框的四个角点的位置信息;
根据所述四个角点的位置信息识别出所述PPT边框;
所述特征提取层包括:第一卷积层和反卷积层;
所述含有PPT文档信息的图片输入所述第一卷积层,所述第一卷积层输出所述图片所对应的图片特征层;
将所述图片特征层输入所述反卷积层,所述反卷积层输出所述图片特征层所对应的特征图;
所述轮廓分割层包括:第一卷积核;
所述特征图输入所述卷积核,经过卷积操作后,输出轮廓分割图像;
所述角点定位层包括:第二卷积核;
将所述轮廓分割图像依次输入所述第二卷积核,重复四次,分别得到四次卷积操作后输出的所述四个角点的位置信息;
所述神经网络还包括:全连接层;
所述方法还包括:
根据所述四个角点的位置信息,从特征图中提取出其所对应的特征向量;
将所述特征向量输入若干个全连接层,得到输出的四个角点在图片上的角点位置修正信息。
2.根据权利要求1所述的基于神经网络的PPT边框识别方法,其特征在于,所述方法还包括:
对含有PPT文档信息的图片进行预处理,将其缩放为预设尺寸的图片后,再输入到特征提取层。
3.根据权利要求1所述的基于神经网络的PPT边框识别方法,其特征在于,所述特征提取层为已训练的Mobilenet v2网络结构和所述反卷积层的组成,或者所述特征提取层为编码-解码网络结构。
4.一种基于神经网络的PPT边框识别装置,其特征在于,所述神经网络包括:特征提取层、轮廓分割层和角点定位层:
所述PPT边框识别装置包括:
特征提取模块,用于将含有PPT文档信息的图片输入所述特征提取层中进行特征提取,得到所述特征提取层输出的图片的特征图;
轮廓分割模块,用于将所述图片的特征图输入到所述轮廓分割层,得到所述轮廓分割层输出的轮廓分割图像;
角点定位模块,用于将所述轮廓分割图像输入所述角点定位层,得到所述角点定位层输出的PPT边框的四个角点的位置信息;
边框识别模块,用于根据所述四个角点的位置信息识别出所述PPT边框;
所述特征提取层包括:第一卷积层和反卷积层;
所述含有PPT文档信息的图片输入所述第一卷积层,所述第一卷积层输出所述图片所对应的图片特征层;
将所述图片特征层输入所述反卷积层,所述反卷积层输出所述图片特征层所对应的特征图;
所述轮廓分割层包括:第一卷积核;
所述特征图输入所述卷积核,经过卷积操作后,输出轮廓分割图像;
所述角点定位层包括:第二卷积核;
将所述轮廓分割图像依次输入所述第二卷积核,重复四次,分别得到四次卷积操作后输出的所述四个角点的位置信息;
所述神经网络还包括:全连接层;
所述装置 还包括:
根据所述四个角点的位置信息,从特征图中提取出其所对应的特征向量;
将所述特征向量输入若干个全连接层,得到输出的四个角点在图片上的角点位置修正信息。
5.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至3中任一项所述方法的步骤。
6.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至3中任一项所述的方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳职业技术学院,未经深圳职业技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910562994.9/1.html,转载请声明来源钻瓜专利网。