[发明专利]用于确定图像中的子图块类别的卷积神经网络的建模方法有效

专利信息
申请号: 201811013691.3 申请日: 2018-08-31
公开(公告)号: CN109410168B 公开(公告)日: 2021-11-16
发明(设计)人: 李梢;侯思宇 申请(专利权)人: 清华大学
主分类号: G06T7/00 分类号: G06T7/00;G06T7/11;G06N3/04;G06N3/08
代理公司: 北京金恒联合知识产权代理事务所 11324 代理人: 李强
地址: 100084 北京市海*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明采用神经网络对舌象图片进行预处理,具有好的自适应与鲁棒性;舌象图片被分割成150*150*3像素子图块,只标注各子图块是否包含舌头区域。本发明的神经网络结构简单,仅包含卷积核个数为10、10、1的3个卷积层、2个池化层、2个全连接层(包含300,100个神经元)、输出层;本发明可应用于包括智能手机的各种智能终端,摆脱了硬件计算能力的限制,使舌象定位的适用范围获得了极大的扩展。个人用户可以用个人的智能手机、IPAD、平板等便携智能终端完成舌象的定位处理,不再需要把舌象照片上传到处理中心,使得分布式舌象采集/处理/分析系统的设计更加灵活,资源利用率也得到显著提升。
搜索关键词: 用于 确定 图像 中的 子图块 类别 卷积 神经网络 建模 方法
【主权项】:
1.用于确定图像中的子图块的类别的卷积神经网络模型的建模方法,其特征在于包括:构建卷积神经网络的步骤,和训练卷积神经网络模型的步骤,其中:所述卷积神经网络包括:输入层,输入层为对图像进行分割得到的尺寸大小为150*150*3的子图块,第一、第二和第三卷积层,分别含有10、10、1个卷积核,所有卷积核的大小均为5*5,第一池化层和第二池化层,分别位于第一卷积层和第二卷积层之后,并且为核大小为2*2的平均池化层,全连接层,全连接层包括两层,分别具有300和100个神经元,输出层,构建卷积神经网络的步骤包括:使卷积层中的神经元与卷积层的小矩形感受域中的像素相连,使三个卷积层中的下一层卷积层中的每个神经元仅与位于上一层卷积层中的小矩形感受域相连接,从而使得卷积神经网络专注于上一个层级的低级特征,然后将这些低级特征组装成下一个层级的高级特征,使池化层中的每个神经元都连接到前一层中有限数量的神经元的输出,连接的前一层神经元在空间结构上位于一个小矩形内,该小矩形是池化层的内核,把每一个2×2大小、跨度为2的内核中的平均值输入到下一层,使第三卷积层经过延展变换与全连接层相连,使全连接层与输出层相连,得到图像对于每个类别的softmax交叉熵,对通过第一至第三卷积层得到的特征,经由全连接层的前向传播,得到子图块归属于每一类别的预测值的大小,并利用softmax回归确定出子图块属于每一类别的概率值,训练卷积神经网络模型的步骤包括:用交叉熵作为损失函数,如公式(1)所示,其中Loss是交叉熵的值,n为输入的样本子图块的数目,p为期望输出概率,即样本子图块归属于每一类的真实值,q为卷积神经网络通过前向传播计算得到的实际输出,即子图块归属于每一类的预测值。利用损失函数确定所述预测值与预先给定的样本子图块归属于每一类的真实值之间的交叉熵,按照公式(2),利用反向传播算法和随机梯度下降对卷积神经网络的参数进行训练与更新,其中W表示卷积神经网络中的参数值,α为学习率,使得采用卷积神经网络的样本子图块的类别的预测值与真实值之间的误差不断下降,经过多次的循环,得到训练完善的卷积神经网络。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201811013691.3/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top