[发明专利]视频、讲义PPT和语音内容精准匹配的方法和系统在审

专利信息
申请号: 201710179528.3 申请日: 2017-03-23
公开(公告)号: CN107920280A 公开(公告)日: 2018-04-17
发明(设计)人: 黄叶敏;林南晖;郑凯;李昊 申请(专利权)人: 广州思涵信息科技有限公司;华南师范大学
主分类号: H04N21/44 分类号: H04N21/44;H04N21/435;H04N21/43;H04N21/472;H04N21/845;H04N5/92;H04N5/278;G10L15/26;G09B5/06;G06F17/30;G06K9/00;G06Q50/20
代理公司: 广州粤高专利商标代理有限公司44102 代理人: 林丽明
地址: 510640 广东省广州*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 视频 讲义 ppt 语音 内容 精准 匹配 方法 系统
【权利要求书】:

1.一种视频、讲义PPT和语音内容精准匹配的方法,其特征在于,包括以下步骤:

S1:视频采集处理:通过摄像机摄录教师讲课视频,同时通过教师上课播放PPT的电脑上安装的录屏软件录制电脑视频,以课程名为索引,将教师讲课视频和电脑视频进行合并处理;

S2:图像识别处理:根据图像变化将录屏软件录制的电脑视频分割为若干视频段,将视频中文字相同的视频段合并,记录视频分段的时间值;

S3:语音识别处理:提取教师讲课视频中的语音信息并转换为文字,记录每句话语的时间值;

S4:精准匹配:以课程名和时间值为索引,建立视频、图像、语音和内容之间的数据关联。

2.根据权利要求1所述的视频、讲义PPT和语音内容精准匹配的方法,其特征在于,步骤S1中,视频采集处理具体包括以下步骤:

S1.1:在课堂教学环境部署一台摄像机,以摄录教师讲课视频;

S1.2:在教师上课播放PPT的电脑上安装录屏软件,录制电脑视频;

S1.3:以课程名为索引,将教师讲课视频和电脑视频进行合并处理。

3.根据权利要求2所述的视频、讲义PPT和语音内容精准匹配的方法,其特征在于,步骤S1中,教师讲课视频和电脑视频所部署的网络环境一致,确保两路视频的时间戳保持一致。

4.根据权利要求1所述的视频、讲义PPT和语音内容精准匹配的方法,其特征在于,步骤S2中,图像识别处理具体包括以下步骤:

S2.1:根据图像变化将录屏软件录制的电脑视频分割为若干视频段;

S2.2:提取各视频段的第一帧图像;

S2.3:提取图像中的文字信息;

S2.4:比较文字是否发生变化;

S2.5:合并文字未发生变化的视频段;

S2.6:对于新的视频段重复步骤S2.1-S2.4,直到视频段数量没有变化,从而得到根据讲义PPT页面发生翻页时分割的视频段;

S2.7:记录各视频段的时间值,对应提取的文字,存入数据库。

5.根据权利要求1所述的视频、讲义PPT和语音内容精准匹配的方法,其特征在于,步骤S2中,所述方法还包括:直接提取PPT文件中每一页的文字信息并记录页码。

6.根据权利要求1所述的视频、讲义PPT和语音内容精准匹配的方法,其特征在于,步骤S3中,语音识别处理具体包括以下步骤:

S3.1:将教师讲课视频转换成音频文件;

S3.2:利用语音处理引擎,将音频转换成文字;

S3.3:对文字进行分词处理;

S3.4:对处理的分词进行词性标注;

S3.4:完成基础语义识别,记录每句话语的时间值,存入数据库。

7.根据权利要求1所述的视频、讲义PPT和语音内容精准匹配的方法,其特征在于,步骤S4中,所述方法还包括:

将音频转换成的到的文字作为字幕添加到教师讲课视频中。

8.根据权利要求1所述的视频、讲义PPT和语音内容精准匹配的方法,其特征在于,步骤S4中,所述方法还包括:

将处理过的视频、语音、文字同步至在线教学系统。

9.根据权利要求8所述的视频、讲义PPT和语音内容精准匹配的方法,其特征在于,步骤S4中,所述方法还包括:

提供搜索引擎,对数据库进行基于内容的搜索、定位,并在在线教学系统上进行视频播放。

10.一种视频、讲义PPT和语音内容精准匹配的方法,其特征在于,包括:

视频采集处理模块:用于通过摄像机摄录教师讲课视频,同时通过教师上课播放PPT的电脑上安装的录屏软件录制电脑视频,以课程名为索引,将教师讲课视频和电脑视频进行合并处理;

图像识别处理模块:用于根据图像变化将录屏软件录制的电脑视频分割为若干视频段,将视频中文字相同的视频段合并,记录视频分段的时间值;或者,直接提取PPT文件中每一页的文字信息并记录页码;

语音识别处理模块:用于提取教师讲课视频中的语音信息并转换为文字,记录每句话语的时间值;

精准匹配模块:用于以课程名和时间值为索引,建立视频、图像、语音和内容之间的数据关联。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州思涵信息科技有限公司;华南师范大学,未经广州思涵信息科技有限公司;华南师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710179528.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top