[发明专利]图像处理方法及相关装置有效
申请号: | 202310572984.X | 申请日: | 2023-05-22 |
公开(公告)号: | CN116304146B | 公开(公告)日: | 2023-10-20 |
发明(设计)人: | 李宇;蒋雪涵 | 申请(专利权)人: | 荣耀终端有限公司 |
主分类号: | G06F16/532 | 分类号: | G06F16/532;G06F16/583;G06F16/58;G06F16/54;G06F3/0481 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 余娜;黄健 |
地址: | 518040 广东省深圳市福田区香蜜湖街道*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 处理 方法 相关 装置 | ||
本申请实施例提供的图像处理方法及相关装置,涉及终端技术领域。方法包括:电子设备在第一界面接收用户输入的文本;电子设备区分显示第一图像文件以及第二图像文件,其中,第一图像文件为待处理图像文件中与文本中关键词匹配的图像文件,第二图像文件为待处理图像文件中与文本中关键词不匹配的图像文件;第一图像文件为电子设备中的第一模型基于文本和待处理图像文件确定的,第一模型是根据图文对样本集进行训练得到;图文对样本集中包括:样本图像与样本图像对应的文本,样本图像中一个或多个对象以及各一个或多个对象对应的文本。这样,能够将用户输入的文案与图像文件对应的文本描述进行更好的匹配,从而实现文案和图像文件的关联。
技术领域
本申请涉及终端技术领域,尤其涉及图像处理方法及相关装置。
背景技术
随着多媒体技术的发展,一些电子设备中可以提供一键成片的功能,一键成片可以将用户选中的图像文件生成不同的风格、颜色或修改效果。
然而,一键成片不支持用户输入自定义文案,并将图像文件和文案进行关联。
发明内容
本申请实施例提供的图像处理方法及相关装置,可以预先进行图文匹配的模型训练,支持在一键成片的界面中接收用户输入的文案,并将图像文件和文案进行关联。
第一方面,本申请实施例提供的图像处理方法,方法包括:
电子设备在第一界面接收用户输入的文本;电子设备区分显示第一图像文件以及第二图像文件,其中,第一图像文件为待处理图像文件中与文本中关键词匹配的图像文件,第二图像文件为待处理图像文件中与文本中关键词不匹配的图像文件;第一图像文件为电子设备中的第一模型基于文本和待处理图像文件确定的,第一模型是根据图文对样本集进行训练得到;图文对样本集中包括:样本图像与样本图像对应的文本,样本图像中一个或多个对象以及各一个或多个对象对应的文本。这样,电子设备可以支持在界面中接收用户输入的文本,且能够将用户输入的文本与待处理图像文件进行匹配,从而实现文本和图像文件的关联。
一种可能的实现中,样本图像对应的文本是通过下述方式得到的:识别样本图像中的一个或多个对象;得到一个或多个对象的文本标签;基于一个或多个对象的文本标签,以及样本图像的源文本得到样本图像对应的文本,样本图像的源文本为预先得到的用于描述样本图像的文本,样本图像的源文本中的关键词少于样本图像对应的文本中的关键词。这样,能够使得输入的文本与样本图像对应的文本进行更好的匹配。
一种可能的实现中,方法还包括:根据目标对象和目标对象的目标文本标签构成的图文对更新第一模型,其中,目标对象和目标文本标签是目标应用中预先得到的,更新后的第一模型具有将目标对象与目标文本标签进行匹配的能力。这样,可以使更新后的第一模型具有将目标对象与目标文本标签进行匹配的能力,从而可以识别用户标记过的图文对。
一种可能的实现中,第一模型是基于第二模型得到的,第二模型包括基于图文对样本集进行训练得到的模型,方法还包括:获取目标应用中的第三图像文件,第三图像文件包括目标对象;将第三图像文件的相关数据上传给第二模型,第三图像文件的相关数据包括:目标对象的图像、目标文本标签和在第三图像文件中去掉目标对象后得到的图像文件;第二模型基于第三图像文件的相关数据进行训练,得到第三图像文件对应的文本;基于第三图像文件对应的文本更新第一模型,更新后的第一模型具有将第三图像文件与第三图像文件对应的文本进行匹配的能力。这样,可以使得更新后的第一模型具有将第三图像文件与第三图像文件对应的文本进行匹配的能力。
一种可能的实现中,目标对象包括人物图像,目标文本标签包括人物称呼。这样,可以识别用户标记过的人物相关的图文对,使得该第一模型可以对图像文件的描述更为详细和准确。
一种可能的实现中,方法还包括:电子设备响应于用户触发第二图像文件的操作,显示第二界面,第二界面包括:用于提示第二图像文件为待处理图像文件中与文本不匹配的图像文件的信息。这样,显示第二界面可以让用户及时了解到某个图像未与文本进行匹配,用户可以对未匹配的图像进行处理,提升用户体验。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于荣耀终端有限公司,未经荣耀终端有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310572984.X/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序