[发明专利]图片集描述方法及装置有效
申请号: | 201910186100.0 | 申请日: | 2019-03-12 |
公开(公告)号: | CN109902759B | 公开(公告)日: | 2021-03-30 |
发明(设计)人: | 周曦;姚志强;谭涛;周翔;李夏风;吴媛;汤文洁;吴大为 | 申请(专利权)人: | 恒睿(重庆)人工智能技术研究院有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/58 |
代理公司: | 上海光华专利事务所(普通合伙) 31219 | 代理人: | 尹丽云 |
地址: | 401121 重庆市渝北*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图片集 描述 方法 装置 | ||
1.一种图片集描述方法,其特征在于,所述方法包括:
获取包括至少一张图片的待描述图片集所对应的主要图像场景,提取所述待描述图片集中的每张图片的图像特征,并根据预存的场景识别模型及得到的每张图片的图像特征对每张图片的图片场景进行识别,对识别出的每种所述图片场景在所述待描述图片集中对应的图片张数进行统计,并根据统计结果计算图片张数最大的目标图片场景在所述待描述图片集处的出现置信度,将所述出现置信度与预设的置信度阈值进行比较,并在所述出现置信度不小于所述置信度阈值时将所述目标图片场景作为所述主要图像场景;从存储的至少一种图像场景对应的自然语言描述模板中,选取与所述主要图像场景匹配的目标描述模板,其中,存储的每种图像场景对应至少一个自然语言描述模板;
根据所述主要图像场景及所述目标描述模板生成与所述待描述图片集对应的自然语言描述文本;
每种图像场景对应的自然语言描述模板的模板种类包括第一类描述模板、第二类描述模板、第三类描述模板及第四类描述模板中的任意一种或多种的组合,所述从存储的至少一种图像场景对应的自然语言描述模板中,选取与所述主要图像场景匹配的目标描述模板的步骤,包括:在存储的至少一种图像场景所对应的自然语言描述模板中,筛选出与所述主要图像场景对应的所有自然语言描述模板;读取所述待描述图片集的拍摄时间及拍摄地点,并在筛选出的所有自然语言描述模板中检测是否存在与所述拍摄时间及所述拍摄地点匹配的第一类描述模板;若检测到存在所述第一类描述模板,则以所述第一类描述模板作为所述目标描述模板;若检测到未存在所述第一类描述模板,则在筛选出的所有自然语言描述模板中检测是否存在只与所述拍摄地点匹配的第二类描述模板及只与所述拍摄时间匹配的第三类描述模板,并根据检测结果确定出所述目标描述模板。
2.根据权利要求1所述的方法,其特征在于,所述在筛选出的所有自然语言描述模板中检测是否存在只与所述拍摄地点匹配的第二类描述模板及只与所述拍摄时间匹配的第三类描述模板,并根据检测结果确定出所述目标描述模板的步骤,包括:
若检测到存在所述第二类描述模板,则以所述第二类描述模板作为所述目标描述模板;
若检测到未存在所述第二类描述模板却存在所述第三类描述模板,则以所述第三类描述模板作为所述目标描述模板;
若检测到未存在所述第二类描述模板及所述第三类描述模板,则以筛选出的所有自然语言描述模板中的第四类描述模板作为所述目标描述模板。
3.根据权利要求1-2中任意一项所述的方法,其特征在于,所述方法还包括:预先对至少一种图像场景所对应的自然语言描述模板进行配置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于恒睿(重庆)人工智能技术研究院有限公司,未经恒睿(重庆)人工智能技术研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910186100.0/1.html,转载请声明来源钻瓜专利网。