[发明专利]一种根据食谱生成食物图像的方法在审

专利信息
申请号: 202010846696.5 申请日: 2020-08-21
公开(公告)号: CN112017255A 公开(公告)日: 2020-12-01
发明(设计)人: 戴超;盛斌;潘思源;贺加原 申请(专利权)人: 上海志唐健康科技有限公司
主分类号: G06T11/00 分类号: G06T11/00;G06K9/62;G06F40/30;G06N3/04;G06N3/08
代理公司: 暂无信息 代理人: 暂无信息
地址: 200030 上海市*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 根据 食谱 生成 食物 图像 方法
【说明书】:

发明提供一种根据食谱生成食物图像的方法,包括:输入食物图像和食谱,利用本发明提出的图像文本嵌入模块ITEM从食谱中提取特征并嵌入,再计算食物图像和食谱的余弦相似度;利用本发明提出的CIGM生成低分辨率图像;结合低分辨率图像和文本特征通过CIGM生成高分辨率图像,逐步训练ITEM和CIGM,在训练CIGM时,固定ITEM的值保持权重不变,在训练CIGM时利用两种损失函数计算方式:由判别器给出的文本图像对语义一致性对抗损失函数和基于ITEM的文本语义损失函数。相比于现有根据食谱生成食物图像的方案,本发明一种根据食谱生成食物图像的方法,在视觉真实性和语义一致性方面都有更好的表现。

技术领域

本发明涉及计算机视觉及自然语言处理领域,尤其涉及一种根据食谱生成食物图像的方法。

背景技术

人们往往会花很多时间在食谱上,因为烹饪与我们的生活息息相关。对食物的解构和理解已经做了大量的工作,包括食物分类,食谱图像的嵌入,根据图像生成图谱。此外,预先实现菜品外观可视化对新菜谱的设计有很大的帮助,对于根据已知菜谱生成图像具有明显的意义。

目前根据已知菜谱生成图像还没有一个比较成熟的技术方案,根据菜谱生成食物图像属于文本到图像(text-to-image T2I)领域,T2I的目标是生成与参考文本具有相同语义意义的图像。T2I可以在不同的语境、不同的方面得到广泛的应用,表现出了很强的能力。因此,引起了计算机视觉和自然语言处理领域研究人员的关注。这些现有的模型在使用简单文本生成图像方面表现良好,如CUB bird数据集和MS COCO数据集。之前有工作通过两个独立阶段生成图像,利用一个判别器将生成的图像与带有相应文本的原始图像进行区分,但是,该模型存在语义不完全的问题,因为文本和图像的领域一致性是单个判别器难以学习的,其认知重点是图像的逼真性。为解决这个问题,镜像对抗生成网络被提出用来重新生成文本,并将其与给定的文本对齐,以便进行正则化,但这种方法不适用于配料的再生。不同于对幼鸟数据集和MS COCO数据集的描述,参考文本总是简单的,例如,“这只鸟有黑色的翅膀和黄色的头部。”一个包括配料和使用说明书的食谱平均可能包含250个单词,因此根据生成的图像重建食谱并不容易。由于内容较长,很难生成与配料语义相同的图像。

发明内容

针对现有技术中存在的上述缺陷,本发明提供了一种根据食谱生成食物图像的方法,可以生成更具有视觉真实性和语义一致性的图像。

依据本发明的一个方面,提供了一种根据食谱生成食物图像的方法,包括以下步骤:

a)输入图像和食谱,利用本发明提出的图像文本嵌入模块ITEM从输入的图像和食谱中提取特征,特征嵌入,再计算图像和食谱的余弦相似度;

b)对ITEM文本特征,利用CIGM获得低分辨率图像;

c)对上述步骤获得的低分辨率图像和文本特征利用CIGM生成高分辨率图像;

d)逐步训练ITEM和CIGM,在训练CIGM时,固定ITEM的值保持权重不变,在训练CIGM时利用两种损失函数计算方式:由判别器给出的文本图像对语义一致性对抗损失函数和基于ITEM的文本语义损失函数。

根据现有的工作,本发明可以从使用说明书中提取到配料,所以,每份食谱包括配料和如何去烹饪食物的说明书,用(rs,rg,v)表示数据片,其中rs表示使用说明书,rg表示原料,v表示相关的图片,本发明用两个长短期记忆人工神经网络LSTM(Long Short-TermMemory)编码器从使用说明书和原料中提取特征,使用词向量来学习每个原料的表示,由于原材料列表是一个无序的集合,本发明选择一个双向LSTM来提取可以对原料列表中的每个单词执行逻辑回归的特征,通过原料编码器Φg,则可得:

hg=Φg(rg) (1)

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海志唐健康科技有限公司,未经上海志唐健康科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010846696.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top