[发明专利]一种基于非线性插值算法的视频标注方法在审
申请号: | 202210889023.7 | 申请日: | 2022-07-27 |
公开(公告)号: | CN115375542A | 公开(公告)日: | 2022-11-22 |
发明(设计)人: | 魏静如;张烈帅;李明明 | 申请(专利权)人: | 浪潮云信息技术股份公司 |
主分类号: | G06T3/40 | 分类号: | G06T3/40;G06V10/75 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 姜明 |
地址: | 250100 山东省济南市高*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 线性插值 算法 视频 标注 方法 | ||
本发明公开了一种基于非线性插值算法的视频标注方法,所述方法通过人工对开始帧、中间帧和结束帧的位置和形状进行调整,通过系统标注工具基于非线性插值算法自动完成其余帧的插值计算。本发明所提供的对于中间帧的非线性插值算法,相比较简单的线性插值,使目标跟踪的轨迹更为平滑的过渡,从而提高自动插值标注的准确性;通过提供的视频自动插值标注算法极大的缩短了标注者进行视频标注的时间,提高了整个视频数据的标注效率;在提供视频自动插值标注的同时,极大地缩减了视频标注的时间,在提高工作效率的同时,又充分考虑用户的主观能动性,进一步提高视频标注的准确率。
技术领域
本发明涉及视频编辑技术领域,具体提供一种基于非线性插值算法的视频标注方法。
背景技术
随着科技的进步,人工智能得到飞速的发展。究其本质,人工智能是“人的智慧”与“机器计算能力”的结合。当下的人工智能依然以数据为导向进行驱动,因此数据标注的多寡与机器智能程度的高低成正比。
数据标注即通过分类、画框、标注、注释等,对图片、语音、文本、视频等数据对象进行处理,标记对象的特征,形成机器可识别信息的过程,或者以作为机器学习基础素材的过程。因此,数据是机器学习的基础,机器学习建立在数据建模基础上,丰富的标签是机器学习成功建模的前提。
监督学习是目前应用最广泛的机器学习算法,该方法强依赖标注数据,它通过学习大量标注的训练样本来构建预测模型。深度学习也需要大量数据的“投喂”,以深度学习为代表的机器学习框架都需要在大型的监督数据集上进行训练,深度学习只有在拥有充足标注数据的场景下才能发挥它的威力,但在很多实际的应用中却没有足够的标注数据。
AI技术在全场景的落地以及大数据时代的到来产生了海量、指数级别的数据,数据获取也相对变得容易,然而,想要获得大量的已标注数据却并不容易,往往需要付出很大的人力、物力、财力成本。
发明内容
在实际操作中,主要发现已有视频标注至少存在以下缺陷:已存在视频的线性插值算法,未考虑目标移动轨迹的平滑特性;在对视频进行预处理时,不支持用户来决定抽帧方式;不能同时兼顾自动标注及人工标注的优点;不支持多用户进行标注和审核,从而提升标注效率及准确度。
本发明的目的是提供一种基于非线性插值算法的视频标注方法,旨在通过多人人工标注、自动非线性插值标注和多人审核来提升视频标注的准确率和效率。
鉴于以上问题和技术,本发明提供了如下技术方案:
一种基于非线性插值算法的视频标注方法,所述方法的实现包括内容如下:
人工对开始帧、中间帧和结束帧的位置和形状进行调整,
系统标注工具基于非线性插值算法自动完成其余帧的插值计算。
更进一步的,所述非线性插值算法为点插值算法或多边形插值算法。
更进一步的,所述点插值算法的计算过程如下:
如果在开始帧和结束帧中两个相邻位置的都存在一个点,则在这些位置之间使用线性插值,否则所有中间帧点的位置都与开始帧点位置保持一致。
更进一步的,所述多边形插值算法的计算过程如下:
(1)将多边形转化为多线段进行处理,分别将各顶点由(x,y)坐标系转变为l坐标系,具体步骤如下所示:
i.分别获取开始帧、中间帧和结束帧的偶数顶点集合;
ii.针对上述顶点集合进行坐标系转换;
(2)基于开始帧、中间帧和结束帧三个顶点对其进行非线性插值计算。
更进一步的,所述顶点集合坐标系转换过程,针对每一个顶点,其l坐标系偏移向量计算公式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮云信息技术股份公司,未经浪潮云信息技术股份公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210889023.7/2.html,转载请声明来源钻瓜专利网。