[发明专利]场景结构的学习方法、装置及电子设备在审

申请号：	201811285677.9	申请日：	2018-10-31
公开（公告）号：	CN109658418A	公开（公告）日：	2019-04-19
发明（设计）人：	何雷;侯瑞杰;沈莉霞;杨光垚;彭亮;董芳芳;宋适宇	申请（专利权）人：	百度在线网络技术（北京）有限公司
主分类号：	G06T7/11	分类号：	G06T7/11;G06K9/32;G06K9/62;G06N3/04;G06N3/08;G06T7/50
代理公司：	北京同立钧成知识产权代理有限公司 11205	代理人：	孙静;刘芳
地址：	100085 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明实施例提供一种场景结构的学习方法、装置及电子设备，该方法包括：获取训练样本集，训练样本集包括每个场景的多个连续的图像帧；将多个连续的图像帧输入至训练模型中，得到训练模型输出的预测深度信息和预测语义信息，其中，训练模型至少包括深度估计网络和语义分割网络；根据深度估计网络的第一损失函数和语义分割网络的第二损失函数，对训练模型进行训练，得到训练后的模型；其中，第一损失函数是根据预测深度信息和预测语义信息确定的；该方法实现了端到端的训练过程，提高了训练模型的场景结构的识别准确性；另外，在对场景深度信息进行预测时，还将场景的语义信息作为先验信息，进一步提高了训练模型的场景结构的识别准确性。
搜索关键词：	训练模型场景结构损失函数语义信息预测装置及电子设备训练样本集深度估计深度信息语义分割图像帧网络场景深度信息场景先验信息训练过程输出学习
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种场景结构的学习方法，其特征在于，包括：获取训练样本集，所述训练样本集包括每个场景的多个连续的图像帧；将所述多个连续的图像帧输入至训练模型中，得到所述训练模型输出的预测深度信息和预测语义信息，其中，所述训练模型至少包括深度估计网络和语义分割网络；根据所述深度估计网络的第一损失函数和所述语义分割网络的第二损失函数，对所述训练模型进行训练，得到训练后的模型；其中，所述第一损失函数是根据所述训练模型输出的预测深度信息和预测语义信息确定的。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于百度在线网络技术（北京）有限公司，未经百度在线网络技术（北京）有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201811285677.9/，转载请声明来源钻瓜专利网。

上一篇：改进图像分割学习方法和装置及使用其的测试方法和装置
下一篇：一种医学图像中小器官的分割方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06T 一般的图像数据处理或产生
G06T7-00 图像分析，例如从位像到非位像
G06T7-20 .运动分析
G06T7-40 .结构分析
G06T7-60 .图形属性的分析，例如一个图像的区域、重心、周边

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]场景结构的学习方法、装置及电子设备在审

专利文献下载