[发明专利]标注方法、装置及电子设备在审
申请号: | 201811024596.3 | 申请日: | 2018-09-03 |
公开(公告)号: | CN109241907A | 公开(公告)日: | 2019-01-18 |
发明(设计)人: | 刘致远;乔非同;龙灏天;李广 | 申请(专利权)人: | 北京旷视科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06F3/0484;G06F3/0487 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 徐丽 |
地址: | 100000 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标注 唇部 指令 装置及电子设备 图像处理 图像 唇语识别 发出指令 交互方式 屏幕距离 图像匹配 自动执行 快捷键 坐姿 键盘 视力 鼠标 申请 配合 学习 | ||
1.一种标注方法,其特征在于,包括:
获取标注人员的唇部图像;
对所述唇部图像进行唇语识别,确定与所述唇部图像匹配的标注指令;
根据所述标注指令,对当前的标注对象进行标注操作。
2.根据权利要求1所述的方法,其特征在于,所述获取标注人员的唇部图像包括:
获取图像采集装置采集的图像,对所述图像进行人脸检测;
若检测所述图像包含人脸,则从所述图像中获取标注人员的唇部图像。
3.根据权利要求1所述的方法,其特征在于,所述对所述唇部图像进行唇语识别,确定与所述唇部图像匹配的标注指令包括:
提取所述唇部图像中的唇部动作信息;
基于预先训练的唇语识别模型,对所述唇部动作信息进行唇语识别,得到对应的识别结果;
根据所述识别结果确定与所述唇部图像匹配的标注指令。
4.根据权利要求3所述的方法,其特征在于,所述唇语识别模型的训练过程包括:
获取不同年龄、不同性别、不同嘴形的唇语发出者对应的唇部图像样本;
基于所述唇部图像样本及预先标注的识别结果对预训练的模型进行训练,得到唇语识别模型。
5.根据权利要求1所述的方法,其特征在于,所述对所述唇部图像进行唇语识别,确定与所述唇部图像匹配的标注指令之后,还包括:
如果所述标注指令为空,则生成并显示指令错误的提示信息;
如果所述标注指令不为空,则显示所述标注指令。
6.根据权利要求1所述的方法,其特征在于,所述获取标注人员的唇部图像之前,还包括:
接收唇语辅助开启指令;
根据所述唇语辅助开启指令,开启图像采集装置,以对标注人员进行图像采集。
7.根据权利要求1所述的方法,其特征在于,所述标注指令包括标注正样本指令、标注负样本指令、放大指令、缩小指令、切换上一张指令、切换下一张指令以及撤销指令中的一种或者多种。
8.一种标注装置,其特征在于,包括:
图像获取模块,用于获取标注人员的唇部图像;
指令确定模块,用于对所述唇部图像进行唇语识别,确定与所述唇部图像匹配的标注指令;
标注操作模块,用于根据所述标注指令,对当前的标注对象进行标注操作。
9.一种电子设备,包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1至7任一项所述的方法。
10.一种具有处理器可执行的非易失的程序代码的计算机可读介质,其特征在于,所述程序代码使所述处理器执行所述权利要求1至7任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京旷视科技有限公司,未经北京旷视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811024596.3/1.html,转载请声明来源钻瓜专利网。