[发明专利]一种基于多源信息融合的细粒度图像分类方法在审

专利信息
申请号: 202110393741.0 申请日: 2021-04-13
公开(公告)号: CN113516156A 公开(公告)日: 2021-10-19
发明(设计)人: 赵云波;花婷婷;宋涛;王岭人 申请(专利权)人: 浙江工业大学
主分类号: G06K9/62 分类号: G06K9/62;G06N3/04;G06N3/08
代理公司: 杭州天正专利事务所有限公司 33201 代理人: 王兵
地址: 310014 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 信息 融合 细粒度 图像 分类 方法
【权利要求书】:

1.一种基于多源信息融合的细粒度图像分类方法,含有以下步骤:

步骤一:选取细粒度图像里的公开数据集Caltech UCSD Bird 200-2011进行下载;

步骤二:基于上述数据集构建类-属性特征关联的知识图谱;

步骤三:训练基于计算机视觉算法的细粒度图像分类神经网络,并保存最优模型:选择ResNet50网络,使用Batch Normalization代替Dropout,并利用步骤一数据集对网络进行训练和测试,调整学习率,直至测试精度达到一个稳定的最高值;

步骤四:分析步骤三分类模型给出的预测概率结果p(c|x),选取合适的阈值,以便将计算机识别有误的情况最大化筛选出来:预测概率在阈值内的需借助多源信息另作辅助预测,而阈值以外的则以计算机视觉算法预测结果为准;

步骤五:对于需做进一步判断的细粒度图像,依据步骤三模型给出的可能类概率信息,在步骤二构建好的知识图谱上进行相关特征信息查询,选取最具信息性的特征节点属性作为问题向人类用户进行询问:对特征节点的检索,这里采用计算相关特征节点的信息增益方式进行,最终选择信息增益值最大的特征属性作为问题的形式提出,计算公式如下:

IG(ai)=H(c|x)-H(c|x,ai)

这里,ai表示从知识图谱检索到的相关特征属性节点,x表示输入的细粒度图像,c表示细粒度图像所属类别,p(c|x,ai)则表示在已知图像和某一局部特征ai情况下该细粒度图像所属类别的概率,H(c|x,ai)即为p(c|x,ai)的熵,也就是在已知ai这一特征属性条件下,能够让x属于某c类的信息量多少;

步骤六:人类用户介入系统所提出的问题,根据自己的视觉感知信息给予回答:一般设定系统提出的都是关于特征属性的二进制问题,人类通过观察图像给予“是”或“否”的回答。这里基于人类视觉的信息传输用U来表示,且U={maxIG(ai),p(ai,ri|c)},其中ri表示用户回答的置信度,设定“猜测,可能,确定”这三个参数作为人类决策过程的置信判断;

步骤七:计算机结合嵌入的多源信息(知识图谱、人类的视觉信息),重新做概率预测

并输出最终分类结果。

2.如权利要求1所述的一种基于CUB鸟类数据集的细粒度图像分类的方法,其特征在于:所述的细粒度类别图像对应的特征包括:鸟的喙、腹、喉咙、冠、尾、背、前额、颈、眼睛、羽毛等15个关键部位所对应的颜色、形状、图案等312个属性值。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110393741.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top