[发明专利]一种基于YOLOv3的视觉投影交互方法有效

申请号：	201910090253.5	申请日：	2019-01-30
公开（公告）号：	CN109683719B	公开（公告）日：	2021-10-22
发明（设计）人：	谢巍;张伟东;刘亚文;李鸿斌	申请（专利权）人：	华南理工大学
主分类号：	G06F3/01	分类号：	G06F3/01;G06F3/042;G06K9/00;G06K9/40
代理公司：	广州粤高专利商标代理有限公司 44102	代理人：	何淑珍;黄海波
地址：	511458 广东省广州市***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于 yolov3 视觉投影交互方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于YOLOv3的视觉投影交互方法，采用视觉投影交互系统，所述的视觉投影交互系统包括投影仪、近红外激光、带近红外滤光片的摄像头、普通摄像头和电脑，所述近红外激光沿投影面安装，上下各两个，用以形成近红外激光面；所述普通摄像头与电脑相连，用于捕捉用户做出双手动作时刻的画面；所述带近红外滤光片的摄像头安装于相对所述投影面的支架上且所述与电脑电气相连，用于捕捉用户双手动作的作用物触及近红外激光面时的画面，所述投影仪安装于相对所述投影面的支架上，用以向投影面投影交互画面，其特征在于，包括步骤：

S1、收集预定数量的拉弓时刻的画面训练集，并对所述拉弓时刻的画面训练集进行标注；

S2、使用迁移学习的方式对采用的预训练模型为yolov3-voc.cfg和darknet53.conv.74进行训练，最终得到基于YOLOv3的双手检测模型；

S3、打开近红外激光，构建近红外激光面，投影仪将交互界面投向激光面；

S4、利用安装有滤光片的摄像头采集箭击中时刻的画面；

S5、将所述箭击中时刻的画面转换为灰度图像，根据灰度阈值对画面进行二值化转换；具体是利用OPENCV库的cvCvtColor函数，在进行二值化时按如下公式进行：

其中y为灰度值，ε为阈值；

S6、采用腐蚀、膨胀图像处理算法对灰度图像进行降噪处理，获取作用物触及点位置信息；

S7、摄像头采集拉弓时刻的画面；

S8、载入训练好的双手检测模型，将摄像头采集的拉弓时刻的画面传给双手检测模型进行检测，获得位置信息；所述双手检测模型检测过程包括：

feature map中的每个cell预测3个边界框，每个边界框会预测3类参数包括：坐标信息的预测以及置信度预测和每个类别的概率预测，最终模型将结合上述信息和置信度阈值给出最终位置信息；所述坐标信息具体为中心坐标、预测框的高度bh和宽度bw。

2.根据权利要求1所述的基于YOLOv3的视觉投影交互方法，其特征在于，所述拉弓时刻的画面训练集采用的训练数据格式为voc格式，使用labelImg软件进行标注，标记数据格式为xml格式。

3.根据权利要求2所述的基于YOLOv3的视觉投影交互方法，其特征在于，标记后的所述拉弓时刻的画面训练集还采用图像旋转、亮度改变和增加的数据增强方法增加数据集。

4.根据权利要求3所述的基于YOLOv3的视觉投影交互方法，其特征在于，采用腐蚀、膨胀图像处理算法对图像进行降噪处理，获取位置信息时，所述腐蚀和膨胀算法分别采用OPENCV库中的cvErode函数和cvDilate函数。

5.根据权利要求4所述的基于YOLOv3的视觉投影交互方法，其特征在于，在降噪处理后，利用OPENCV库中cvFindContours函数寻找光斑位置，最终得出作用物触及点位置信息。

6.根据权利要求5所述的基于YOLOv3的视觉投影交互方法，其特征在于，所述的近红外激光为一字线型激光管；所述带近红外滤光片的摄像头的近红外滤光片所虑光线波长与所述近红外激光波长相符。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于华南理工大学，未经华南理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910090253.5/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F3-00 用于将所要处理的数据转变成为计算机能够处理的形式的输入装置；用于将数据从处理机传送到输出设备的输出装置，例如，接口装置
G06F3-01 .用于用户和计算机之间交互的输入装置或输入和输出组合装置
G06F3-05 .在规定的时间间隔上，利用模拟量取样的数字输入
G06F3-06 .来自记录载体的数字输入，或者到记录载体上去的数字输出
G06F3-09 .到打字机上去的数字输出
G06F3-12 .到打印装置上去的数字输出

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于YOLOv3的视觉投影交互方法有效

专利文献下载