[发明专利]基于声像的在线培训监视方法在审
申请号: | 201710891827.X | 申请日: | 2017-09-27 |
公开(公告)号: | CN107809665A | 公开(公告)日: | 2018-03-16 |
发明(设计)人: | 纪丹青 | 申请(专利权)人: | 镇江博格信息科技有限公司 |
主分类号: | H04N21/439 | 分类号: | H04N21/439;H04N21/44;H04N21/441 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 212000 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 声像 在线 培训 监视 方法 | ||
1.基于声像的在线培训监视方法,其特征在于,包括如下步骤:
步骤1.搭建声像过程跟踪平台,设置后台模块:
提前通过人脸扫描设备拍摄用户的面部特征,并与用户声明的身份信息绑定;将面部特征分析处理后转化成图像数据代码,并将所述图像数据代码存储到位于在线培训平台上的图像数据代码数据库中;提前利用收音设备录制声音指令,将声音指令分析处理后转化成音频数据代码,并将所述音频数据代码存储到位于在线培训平台上的音频数据库中;
步骤2.进行身份认证:
通过通信网络接受用户终端的登录请求,进行身份认证,同时启动网络摄像头扫描用户面部信息,传输至后台进行人脸识别,若人脸识别结果成功,可正常开始在线培训学习,后台自动调取与该用户学习内容相关的学习资料;若人脸识别结果未成功,提示用户未成功并重新扫描;
步骤3.进行过程跟踪:
在线学习视频播放过程中随时启动网络摄像头抓拍用户面部信息,且在线学习视频播放过程中启动收音设备,定时采集用户的声音指令,根据定时采集到的声音指令和面部信息,实现用户的定位,如声音指令和面部信息不符,则对用户做出提醒并暂停播放。
2.根据权利要求1所述基于声像的在线培训监视方法,其特征在于:所述步骤2中的人脸识别包括基于静态图像的人脸识别和基于视频图像的人脸识别。
3.根据权利要求1所述基于声像的在线培训监视方法,其特征在于:所述步骤1中将声音指令分析处理后转化成音频数据代码的方法如下:
(1)将声音指令进行预处理,即先进行预加重,再进行分帧加窗处理,最后再进行端点检测;
(2)用Mel频率的倒谱系数作为语音特征识别孤立词语语音,最后组合成音频数据代码。
4.根据权利要求3所述基于声像的在线培训监视方法,其特征在于:所述分帧加窗处理采用Hamming窗。
5.根据权利要求3所述基于声像的在线培训监视方法,其特征在于:所述用Mel频率的倒谱系数作为语音特征识别孤立词语语音的方法如下:
首先,将预处理后的声音指令输入Hamming窗帧选,经过Hamming窗帧选的数据进行傅里叶变换;
然后,将傅里叶变换后的数据以滤波组能量的形式输出至进行离散余弦变换,最终输出可识别的音频数据代码。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于镇江博格信息科技有限公司,未经镇江博格信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710891827.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:信息处理方法及电子设备
- 下一篇:根据情绪状态检测处理视频内容的系统和方法