[发明专利]一种基于深度学习的拍摄构图方法和系统有效
申请号: | 201711097542.5 | 申请日: | 2017-11-09 |
公开(公告)号: | CN107705307B | 公开(公告)日: | 2021-01-01 |
发明(设计)人: | 张明;于佳弘;刘博;杨星彤 | 申请(专利权)人: | 睿魔智能科技(东莞)有限公司;东莞松山湖国际机器人研究院有限公司 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T7/60;G06T7/73 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 罗晓林;杨桂洋 |
地址: | 523000 广东省东莞市松山湖高新技术*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 拍摄 构图 方法 系统 | ||
本发明公开了一种基于深度学习的拍摄构图方法和系统,包括以下步骤:对拍摄镜头中的目标对象进行实时感知;建立构图训练集,利用该构图训练集训练深度神经网络,以包含完整目标对象的图片为输入,以最优构图方案为学习目标;将感知到的当前的目标对象输入深度神经网络中,基于该深度神经网络输出当前最优的构图方案,得到包含目标对象的二维平面位置信息和缩放信息。本发明能够自动检测拍摄对象,生成最优构图方案,节省人力成本。
技术领域
本发明属于拍摄领域,具体地说是一种基于深度学习的拍摄构图方法和系统。
背景技术
在传统摄影中,如何确定当前画面的构图是一个非常重要的问题,构图的好坏直接影响拍摄的效果。构图一般由摄影师根据对象需求,结合自身经验,运用九宫格、对角线、X型、三角等构图技巧完成。该过程依赖摄影师的专业知识,对摄影师自身的技能要求较高,人力成本高。没有经过专业训练和学习的人,难以拍摄出较佳效果的画面。
发明内容
本发明要解决的技术问题是提供一种基于深度学习的拍摄构图方法和系统,能够自动检测拍摄对象,生成最优构图方案,节省人力成本,适用范围广。
为了解决上述技术问题,本发明采取以下技术方案:
一种基于深度学习的拍摄构图方法,包括以下步骤:
对拍摄镜头中的目标对象进行实时感知;
建立构图训练集,利用该构图训练集训练深度神经网络,以包含完整目标对象的图片为输入,以最优构图方案为学习目标;
将感知到的当前的目标对象输入深度神经网络中,基于该深度神经网络输出当前最优的构图方案,得到包含目标对象的二维平面位置信息和放缩信息。
所述建立构图训练集具体为:
计算当前画面的放缩倍数z,将目标对象进行放缩z倍处理;
根据构图原则,设定若干条相互交叉的参考线,将所有参考线的所有交点集合定义为Vp={vp};
对目标对象建立完整的骨架模型,标记骨架模型上所有节点vo的集为Vo={vo},节点的坐标(x,y)以拍摄的图像的左上角(0,0)为参考点,骨架模型上的相邻节点之间形成的线段eo的集合标记为Eo={eo},骨架模型上的各节点设定相应的权重wo,该权重集为Wo={wo};
标记骨架模型上某一节点vo到相邻最近的参考线交点的距离为标记骨架模型上某一对相邻节点所形成的线段eo与水平方向的夹角为θ∥(eo)、以及与垂直方向的夹角为θ⊥(eo),并且该线段eo的参考偏移角度被定义为Θ(eo)=min{θ∥(eo),θ⊥)eo)};
在当前拍摄画面中,当目标对象的完整骨架模型节点距参考线交点越近,相邻节点形成的线段与水平方向或垂直方向的角度偏移越小时,构图评分越高,构图方案越优,直到得到最优构图方案。
所述最优的构图方案具体为,在目标对象经过z倍放缩满足成像大小的前提下,寻找获取目标对象的平面位置信息(x,y),使得
最小,其中cost=f(·)为关于自变量的正相关函数,当cost值最小时
目标对象所在的平面位置信息(x,y)为最优位置,构图水平的评分
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于睿魔智能科技(东莞)有限公司;东莞松山湖国际机器人研究院有限公司,未经睿魔智能科技(东莞)有限公司;东莞松山湖国际机器人研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711097542.5/2.html,转载请声明来源钻瓜专利网。