[发明专利]基于声像的在线培训监视方法在审

申请号：	201710891827.X	申请日：	2017-09-27
公开（公告）号：	CN107809665A	公开（公告）日：	2018-03-16
发明（设计）人：	纪丹青	申请（专利权）人：	镇江博格信息科技有限公司
主分类号：	H04N21/439	分类号：	H04N21/439;H04N21/44;H04N21/441
代理公司：	暂无信息	代理人：	暂无信息
地址：	212000 江苏***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于声像在线培训监视方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.基于声像的在线培训监视方法，其特征在于，包括如下步骤：

步骤1.搭建声像过程跟踪平台，设置后台模块：

提前通过人脸扫描设备拍摄用户的面部特征，并与用户声明的身份信息绑定；将面部特征分析处理后转化成图像数据代码，并将所述图像数据代码存储到位于在线培训平台上的图像数据代码数据库中；提前利用收音设备录制声音指令，将声音指令分析处理后转化成音频数据代码，并将所述音频数据代码存储到位于在线培训平台上的音频数据库中；

步骤2.进行身份认证：

通过通信网络接受用户终端的登录请求，进行身份认证，同时启动网络摄像头扫描用户面部信息，传输至后台进行人脸识别，若人脸识别结果成功，可正常开始在线培训学习，后台自动调取与该用户学习内容相关的学习资料；若人脸识别结果未成功，提示用户未成功并重新扫描；

步骤3.进行过程跟踪：

在线学习视频播放过程中随时启动网络摄像头抓拍用户面部信息，且在线学习视频播放过程中启动收音设备，定时采集用户的声音指令，根据定时采集到的声音指令和面部信息，实现用户的定位，如声音指令和面部信息不符，则对用户做出提醒并暂停播放。

2.根据权利要求1所述基于声像的在线培训监视方法，其特征在于：所述步骤2中的人脸识别包括基于静态图像的人脸识别和基于视频图像的人脸识别。

3.根据权利要求1所述基于声像的在线培训监视方法，其特征在于：所述步骤1中将声音指令分析处理后转化成音频数据代码的方法如下：

（1）将声音指令进行预处理，即先进行预加重，再进行分帧加窗处理，最后再进行端点检测；

（2）用Mel频率的倒谱系数作为语音特征识别孤立词语语音，最后组合成音频数据代码。

4.根据权利要求3所述基于声像的在线培训监视方法，其特征在于：所述分帧加窗处理采用Hamming窗。

5.根据权利要求3所述基于声像的在线培训监视方法，其特征在于：所述用Mel频率的倒谱系数作为语音特征识别孤立词语语音的方法如下：

首先，将预处理后的声音指令输入Hamming窗帧选，经过Hamming窗帧选的数据进行傅里叶变换；

然后，将傅里叶变换后的数据以滤波组能量的形式输出至进行离散余弦变换，最终输出可识别的音频数据代码。