[发明专利]基于互联网的图片自动合成系统有效
申请号: | 201911387636.5 | 申请日: | 2019-12-27 |
公开(公告)号: | CN111080748B | 公开(公告)日: | 2023-06-02 |
发明(设计)人: | 关帅鹏;杨震 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06T11/60 | 分类号: | G06T11/60;G06T11/40;G06T5/50;G06T7/11;G06T7/194 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 吴荫芳 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 互联网 图片 自动 合成 系统 | ||
1.基于互联网的图片自动合成系统,其特征在于:本方法的实施过程如下,
步骤(1)获取文本标签并建立前景图片集
把图片中显著区域称为图片前景,图片其余部分称为图片背景;系统首先获取合成图片包含前景的文本标签,输入的文本标签是单独关键字短文本信息或者是长文本信息;当输入内容为长文本信息时,使用基于关键字提取技术提取长文本信息的关键字作为前景的文本标签;确定文本标签后,依托Google Image搜索引擎检索下载与文本标签一致图片,建立图片候选集用于后续的图片筛选;
步骤(2)基于图片特征的一致性排序
针对图片候选集,首先使用合理性检测,删除下载失败的图片;使用复杂性检测,删除背景复杂的图片;接着使用基于HSV颜色直方图的方法,提取图片的颜色信息用于表示视觉特征;利用图片的视觉特征进行一致性排序,构建前景图片集;
步骤(3)基于统计方法收集前景分布信息
前景图片和前景分布是完成图片合成的两个必需因素,所述前景分布是指前景图片在背景图片上的位置、大小信息,其中,背景图片人为选定或者系统默认,前景分布由圆表示,具体使用(x,y,s)T三维特征记录布局信息,圆心在背景图片上的位置(x,y)确定了前景图片在背景图片中的位置,圆所覆盖的范围表示前景图片的大小,s表示圆的半径;建立一个具备良好图像分布的数据库,使用基于统计的方法从数据库中收集与目标图片属同类图片的前景分布用于前景分布推荐,同类图片是指含有相似背景和同种前景的图片;使用目标检测的方法,记录同类图片内前景的分布信息用于下一步前景分布推荐;
步骤(4)为给定的背景图片生成前景布局推荐
建立正规则和负规则来生成布局候选:正规则是指前景布局出现概率,出现概率越高,正分数越高;负规则是根据基于美学规则建立的,即前景不应该覆盖背景的灭点,背景上直线不应穿透前景,,通过负规则得到负分数;将正分数和负分数乘积作为最终得分,将得分高的布局作为推荐;
步骤(5)将前景拼接至背景布局推荐处
使用步骤(2)获得的前景图片和步骤(4)获得的布局推荐将前景无缝融合至背景图片对应位置上;
步骤(4)的实施过程如下,
步骤(4.1)建立正规则和负规则
建立正规则和负规则来生成布局候选:正规则通过统计前景布局出现概率获得,通过步骤(3)获得的前景元素分布信息训练高斯混合模型,用于拟合生成概率,分布出现概率越高,该分布对应的正分数越高;负规则是基于美学中的标准构图规则构建的,负规则包括前景不应该覆盖背景的灭点;背景内直线不应穿透前景;对于给定背景图片,每条反向规则为背景内的像素评分,反向规则的总分是两个独立分数的乘积,反向规则的每个像素分数表示为公式(2):
Score-=Score(V)*Score(L) (2)
其中Score(V)表示灭点反向规则分数,表示为公式(3):
Score(V)=1-λ1×1 (3)
将λ1设置为0.9,公式具体表现为若背景中像素检测为灭点该点分数为0.1,否则为1.
Score(L)直线反向规则分数,表示为公式(4):
Score(L)=1-λ2×1 (4)
将λ2设置为0.7,公式具体表现为若背景中像素检测为直线该点分数为0.3,否则为1.
步骤(4.2)位置推荐
将概率分布与负规则乘积作为推荐位置的最终得分,得分表示为公式(5):
Score=p(x)*Score- (5)
其中p(x)为正规则得分,Score-为负规则得分,根据最终得分生成推荐布局。
2.根据权利要求1所述的基于互联网的图片自动合成系统,其特征在于:步骤(2)的实施过程如下,
步骤(2.1)合理性检测和复杂性检测
合理性检测是为了筛除下载失败的图片,删除内容空白的图片;复杂性检测是为了筛除背景复杂的图片,具体的是指使用显著性检测方法去除图片的背景内容,对于留下的前景区域,使用图像分割算法计算前景区域边缘的分割段数,丢弃段数大于10的图片;
步骤(2.2)图片视觉特征建立
HSV空间是直方图最常用的颜色空间,它的三个分量分别代表色彩(Hue)、饱和度(Saturation)和值(Value),使用H,S和V三个通道构造直方图,将各通道均匀划分为20份,连接形成60维特征向量,每维特征是指落在该小区间内的像素数量;
步骤(2.3)图片特征的一致性排序
采用均值漂移算法对特征数据进行聚类,定义窗口半径即可对图片特征分类;选取数量最多的类,按照与类中心的距离对图片进行一致性排序,选取距离小的图片构成前景图片集;
用卡方距离表示图片特征间距离,图片I和图片J之间的卡方距离定义如公式(1)所示:
其中K=60,Ik,Jk分别表示图片I,J中的第k维特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911387636.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种分离转换装置
- 下一篇:一种抗电动手砂轮锯切割的复合材料及卷帘门