[发明专利]图片指代性分割方法、装置、计算机设备和存储介质在审

申请号：	202110887773.6	申请日：	2021-08-03
公开（公告）号：	CN113592881A	公开（公告）日：	2021-11-02
发明（设计）人：	黄仕嘉;刘枢;吕江波;沈小勇;贾佳亚	申请（专利权）人：	深圳思谋信息科技有限公司;上海思谋科技有限公司
主分类号：	G06T7/11	分类号：	G06T7/11;G06T7/136;G06N3/04;G06K9/62
代理公司：	广州华进联合专利商标代理有限公司 44224	代理人：	樊倩
地址：	518051 广东省深圳市***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	图片指代分割方法装置计算机设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种图片指代性分割方法，其特征在于，所述方法包括：

获取待分割图片，以及针对于所述待分割图片的语言表达式；所述语言表达式用于描述所述待分割图片的分割区域；

将所述待分割图片以及所述语言表达式输入训练完成的图片分割模型，通过所述图片分割模型确定所述待分割图片的视觉特征，以及所述语言表达式的语言特征，对所述视觉特征和所述语言特征进行特征融合，得到针对所述待分割图片的多模态特征，以及根据所述待分割图片的多模态特征获取所述待分割图片中的初始分割区域，根据所述初始分割区域以及所述视觉特征，得到针对所述待分割图片的实例感知特征；

根据所述多模态特征以及所述实例感知特征确定所述待分割图片的目标分割区域，获取所述待分割图片中位于所述目标分割区域的分割图片。

2.根据权利要求1所述的方法，其特征在于，所述确定所述待分割图片的视觉特征，包括：

通过视觉特征提取器获取所述待分割图片不同特征提取阶段得到的多组视觉特征；

所述对所述视觉特征和所述语言特征进行特征融合，得到针对所述待分割图片的多模态特征，包括：

对各特征提取阶段得到的视觉特征分别和所述语言特征进行特征融合，得到所述各特征提取阶段分别对应的多模态特征；

将所述各特征提取阶段分别对应的多模态特征进行融合，得到所述待分割图片的多模态特征。

3.根据权利要求2所述的方法，其特征在于，所述待分割图片的多模态特征包括所述待分割图片中各像素点的多模态特征；

所述根据所述待分割图片的多模态特征获取所述待分割图片中的初始分割区域，包括：

将所述待分割图片中各像素点的多模态特征输入预设的卷积神经网络，通过所述卷积神经网络获取所述待分割图片中各像素点属于所述分割区域的概率；

根据所述概率从所述待分割图片的像素点中确定出目标像素点，将所述目标像素点对应的图片区域作为所述初始分割区域。

4.根据权利要求3所述的方法，其特征在于，所述根据所述初始分割区域以及所述视觉特征，得到针对所述待分割图片的实例感知特征，包括：

获取所述待分割图片中各像素点在不同特征提取阶段得到的多组子视觉特征；