[发明专利]用于放大的增强颜色再现在审
申请号: | 201980068285.3 | 申请日: | 2019-10-17 |
公开(公告)号: | CN112868034A | 公开(公告)日: | 2021-05-28 |
发明(设计)人: | 朱淼琪;高岛芳和 | 申请(专利权)人: | 索尼公司;索尼图片娱乐公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G09G5/02 |
代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 曹瑾 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 放大 增强 颜色 再现 | ||
一种用于在放大过程中增强颜色再现的方法,包括:将RGB格式的数据转换成颜色空间可分离格式的数据;将RGB格式的数据发送到神经网络进行训练,以生成RGB预测数据;将RGB预测数据转换成颜色空间可分离预测数据;通过计算RGB格式的数据和RGB预测数据之间的第一差来计算第一损失函数;从颜色空间可分离格式的数据中提取颜色格式的数据;从颜色空间可分离预测数据中提取颜色预测数据;通过计算颜色格式的数据和颜色预测数据之间的第二差来计算第二损失函数;以及调节第一损失函数和第二损失函数之间的平衡。
相关申请的交叉引用
本申请援引35U.S.C.§119(e)要求于2018年10月18日提交的标题为“Machine-Learning Based Single Image Upscaling Application for Motion Pictures”的共同待决的美国临时专利申请No.62/747,453的优先权权益。上面引用的申请的公开内容通过引用并入本文。
技术领域
本公开涉及图像超分辨率放大,并且更具体而言,涉及用于放大的增强颜色再现。
背景技术
机器学习(ML)可以用于执行图像超分辨率放大。但是,当使用不具有深层神经网络体系架构的RGB图像格式输入时,常规的基于ML的放大过程存在一些已观察到的问题,包括色移和失去像素之间清晰的颜色分离。
发明内容
本公开提供了图像超分辨率放大过程中的增强颜色再现。
在一个实施方式中,公开了一种用于在放大过程中增强颜色再现的方法。该方法包括:将RGB格式的数据转换成颜色空间可分离格式的数据;将RGB格式的数据发送到神经网络进行训练,以生成RGB预测数据;将RGB预测数据转换成颜色空间可分离预测数据;通过计算RGB格式的数据和RGB预测数据之间的第一差来计算第一损失函数;从颜色空间可分离格式的数据中提取颜色格式的数据;从颜色空间可分离预测数据中提取颜色预测数据;通过计算颜色格式的数据和颜色预测数据之间的第二差来计算第二损失函数;以及调节第一损失函数和第二损失函数之间的平衡。
在一个实施方式中,RGB格式的数据是RGB格式的图像,并且颜色空间可分离格式的数据是颜色空间可分离格式的图像。在一个实施方式中,颜色空间可分离格式的数据包括YCbCr格式的数据。在一个实施方式中,从颜色空间可分离预测数据中提取颜色预测数据包括提取YCbCr格式的数据的颜色通道。在一个实施方式中,颜色通道包括YCbCr格式的数据的CbCr通道。在一个实施方式中,颜色空间可分离格式的数据包括Lab格式的数据。在一个实施方式中,调节第一损失函数和第二损失函数之间的平衡包括调节第一损失函数和第二损失函数的权重,直到找到平衡为止。
在另一个实施方式中,公开了一种增强的颜色再现系统。该系统包括:RGB到颜色空间可分离转换器,被配置为将RGB格式的数据转换成颜色空间可分离格式的数据并将RGB预测数据转换成颜色空间可分离预测数据;颜色提取器,被配置为从颜色空间可分离格式的数据中提取颜色格式的数据并从颜色空间可分离预测数据中提取颜色预测数据;损失函数计算器,被配置为通过计算RGB格式的数据和RGB预测数据之间的第一差来计算第一损失函数,并通过计算颜色格式的数据和颜色预测数据之间的第二差来计算第二损失函数;以及调节器,被配置为控制应用于系统输出的第一损失函数的量和第二损失函数的量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼公司;索尼图片娱乐公司,未经索尼公司;索尼图片娱乐公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980068285.3/2.html,转载请声明来源钻瓜专利网。