[发明专利]一种通过修改扩散模型轨迹进行图像补全的方法和系统在审
申请号: | 202310056190.8 | 申请日: | 2023-01-17 |
公开(公告)号: | CN115984141A | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 姜伟昊;黄俊杰;李烈锋;钱冠梁;王志辉;陈梓铭 | 申请(专利权)人: | 杭州东上智能科技有限公司 |
主分类号: | G06T5/00 | 分类号: | G06T5/00;G06V10/774;G06N3/04;G06N3/08;G06V10/74 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 郑海峰 |
地址: | 311202 浙江省杭州市萧山*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 通过 修改 扩散 模型 轨迹 进行 图像 方法 系统 | ||
1.一种通过修改扩散模型轨迹进行图像补全的方法,其特征在于,包括以下步骤:
步骤1,通过可训练的神经网络将部分遮盖后的样本图像映射到原始图像空间;
步骤2,对原始图像进行采样,得到采样图像xt,采样公式为:
其中,t~Uniform({1,…,T}),T为预设的总扩散步数,xt表示第t步的采样图像,c表示部分遮盖后的样本图像,x0表示原始图像,kt表示控制扩散轨迹偏移模式的系数,f(·)表示可训练的神经网络,∈表示采样时添加的符合标准高斯分布的噪声,表示前t步的噪声累积;
步骤3,根据采样图像计算图像补全网络的损失,损失函数为:
其中,gθ(·)表示图像补全网络,其输入为xt和t;
步骤4,根据图像补全网络的损失,更新图像补全网络参数和步骤1中可训练的神经网络参数;
步骤5,利用训练好的神经网络和图像补全网络,逆向生成遮盖图像的补全结果。
2.根据权利要求1所述的一种通过修改扩散模型轨迹进行图像补全的方法,其特征在于,步骤2中,前t步的噪声累积的计算公式为:
αt=1-βt
其中,βt是预设的第t步扩散参数,αt是第t步噪声参数。
3.根据权利要求1所述的一种通过修改扩散模型轨迹进行图像补全的方法,其特征在于,所述的扩散轨迹偏移模式包括:
数据归一化模式:表示将重设不同条件的数据的前向过程的起点,而终点不变的偏移模式;
先验偏移模式:表示将不同条件的数据的前向过程的终点设为xT=f(c),而起点不变的偏移模式。
4.根据权利要求1所述的一种通过修改扩散模型轨迹进行图像补全的方法,其特征在于,所述的图像补全网络采用UNet架构。
5.根据权利要求1所述的一种通过修改扩散模型轨迹进行图像补全的方法,其特征在于,所述的步骤5中,逆向生成遮盖图像的补全结果的公式为:
st=kt·f(c)
其中,βt是预设的第t步扩散参数,αt是第t步噪声参数,gθ(·)是图像补全网络,st是第t步的均值偏移量,f(·)是可训练的神经网络,z表示符合标准高斯分布的噪声,表示高斯分布,I为单位矩阵。
6.根据权利要求5所述的一种通过修改扩散模型轨迹进行图像补全的方法,其特征在于,初始化t=T时,其中sT是第T步的均值偏移量,xT是第T步的补全图像。
7.一种通过修改扩散模型轨迹进行图像补全的系统,其特征在于,包括:
空间映射模块,其用于通过可训练的神经网络将部分遮盖后的样本图像映射到原始图像空间;
图样采样模块,其用于对原始图像进行采样;
损失计算模块,其用于根据采样图像计算图像补全网络的损失;
训练模块,其用于根据图像补全网络的损失,更新可训练的神经网络参数和图像补全网络参数;
图像补全模块,其用于利用训练好的神经网络和图像补全网络,逆向生成遮盖图像的补全结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州东上智能科技有限公司,未经杭州东上智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310056190.8/1.html,转载请声明来源钻瓜专利网。