[发明专利]一种基于大数据训练的鸟类图像识别系统及方法在审
申请号: | 202011400037.5 | 申请日: | 2020-12-01 |
公开(公告)号: | CN112559785A | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 孙月;潘子杰;周脚根 | 申请(专利权)人: | 淮阴师范学院 |
主分类号: | G06F16/55 | 分类号: | G06F16/55;G06F16/951;G06K9/62;G06N3/04 |
代理公司: | 北京盛凡智荣知识产权代理有限公司 11616 | 代理人: | 张成文 |
地址: | 223001*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据 训练 鸟类 图像 识别 系统 方法 | ||
1.一种基于大数据训练的鸟类图像识别系统,其特征在于,包括信息处理模块、移动端、图像数据库、粗图像数据集、候选图像集和模型训练模块,所述移动端与信息处理模块连接,所述粗图像数据集与信息处理模块连接,所述候选图像集与粗图像数据集连接,所述图像数据库与候选图像集连接,所述模型训练模块与图像数据库和信息处理模块连接。
2.根据权利要求1所述的一种基于大数据训练的鸟类图像识别系统,其特征在于,所述粗图像数据集包括搜索关键词库、未下载链接库和已下载链接库。
3.根据权利要求1所述的一种基于大数据训练的鸟类图像识别系统,其特征在于,所述信息处理模块包括神经网络模型处理单元和逻辑计算处理单元,所述神经网络模型处理单元与模型训练模块连接。
4.根据权利要求3所述的一种基于大数据训练的鸟类图像识别系统,其特征在于,所述模型训练模块中设有鸟类图像识别模型。
5.一种基于大数据训练的鸟类图像识别方法,其特征在于,包括如下步骤;
步骤一,鸟类图像爬取:利用爬虫程序收集鸟类图像,建立搜索关键词库,每一个关键词都对应着一个鸟类的中英文名称;爬虫程序遍历关键词库,将关键词按相应内容使用多线程的方式同时发送多个POST请求规则向搜索引擎服务器发送请求,获取搜索引擎服务器反馈的数据,此时反馈的数据为相应关键词检索到的图片集合页面,然后将该页面下载并转换为字符串格式,通过预先写好的正则表达式对字符串进行提取,提取网页中所有被关键词检索得到的图片链接,提取链接后保存图片链接到未下载链接库;对比未下载链接库与已下载链接库把已经下载过的链接从未下载链接库中去除,然后对提取的图片链接进行下载,下载时需要启动守护进程,防止图片下载超时,对于下载超时的图片取消下载直接跳过并进行下一张图片的下载,图片下载后保存图片链接到已下载链接库,并将已下载图片保存至候选图像集;
步骤二,图像清洗及人工分类:对候选图像集中以下2种鸟类图像进行排除:(1)非真实场景图图片,包括鸟类的卡通画图片、鸟类图标、手绘鸟类图片以及其他可以直接分辨出的非真实场景图片;(2)真实场景图片,图片主题不符合检索要求的和图片中目标样本过小或严重遮挡的图片;
通过初步数据清洗操作后,再对一副图中同时存在多种鸟类图像的图片进行图像鉴定和图像分类,将经过数据清洗、图像鉴定和图像分类后的鸟类图像存入图像数据库中;
步骤三,鸟类图像识别模型训练:采用开源的ResNet深度卷积网络架构建立鸟类图像识别模型,所述ResNet深度卷积网络主要由初级卷积层、4个连续卷积层组以及末端分类层组成;
鸟类图像识别模型训练时,对图像数据库进行随机抽样,随机抽取80%作为训练样本,抽取10%作为验证样本,剩余10%作为测试样本,初始学习率设置为0.005,每经过7轮学习率缩小为当前10%,一共训练50轮,每一次训练结束后进行一次验证;
将鸟类图像识别模型存入神经网络模型处理单元中;
步骤四,移动端架构:构建手机小程序作为移动端,通过移动端采集并输入图像,图像将会传入逻辑计算处理单元,逻辑计算处理单元调用神经网络模型处理单元中的鸟类图像识别模型计算得出图像中是否存在鸟,鸟类的分类信息、数量信息和位置信息返回给移动端;
步骤五,利用爬虫程序爬取和收集由移动端上传的鸟类图片,更新图像数据库,通过更新图像数据库并重新训练鸟类图像识别模型,并对神经网络模型处理单元中的鸟类图像识别模型进行更新。
6.根据权利要求5所述的一种基于大数据训练的鸟类图像识别方法,其特征在于,所述鸟类图像识别模型中鸟类图像输入尺度为:224*224*3。
7.根据权利要求5所述的一种基于大数据训练的鸟类图像识别方法,其特征在于,所述逻辑计算处理单元中设有逻辑层,所述逻辑层由Flask实现。
8.根据权利要求5所述的一种基于大数据训练的鸟类图像识别方法,其特征在于,所述抽样的标准为鸟类外接矩形面积对鸟类图像总面积的占比不低于0.2。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于淮阴师范学院,未经淮阴师范学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011400037.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:玻璃模具闷头夹具
- 下一篇:一种基于数据采集单元的故障注入方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置