[发明专利]基于大数据和OCR的网络课堂中文板书结构化分享系统有效
申请号: | 202010109683.X | 申请日: | 2020-02-22 |
公开(公告)号: | CN111353397B | 公开(公告)日: | 2021-01-01 |
发明(设计)人: | 杨丽纳;程兰芝;钟大成;尚宇;张颢倚;刘楚然;余淼;刘少卿 | 申请(专利权)人: | 郑州铁路职业技术学院 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08;G06Q50/20 |
代理公司: | 郑州芝麻知识产权代理事务所(普通合伙) 41173 | 代理人: | 董晓勇 |
地址: | 451460 河南*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 数据 ocr 网络课堂 中文 板书 结构 化分 系统 | ||
1.一种基于大数据和OCR的网络课堂中文板书结构化分享系统,其特征在于,该系统包括:
图像获取单元,用于基于网络课堂的应用程序接口获取课件图像以及板书图像;
课件排版特征提取单元,用于将课件图像输入课件排版风格编码器、课件排版风格解码器构成的神经网络,进行前向传播,得到第一张量;
板书书写特征提取单元,用于将板书图像输入板书书写风格编码器、板书书写风格解码器构成的神经网络,进行前向传播,得到第二张量;
张量融合单元,用于将尺寸相同的第一张量、第二张量按通道维度进行拼接合并操作,得到通道数更高的第三张量;
混合特征提取单元,用于将第三张量输入混合特征编码器进行编码处理,并将编码结果输入全连接网络,得到高维特征向量;
文字识别单元,用于基于OCR模块对板书图像进行文字识别,得到中文字符数量;
板书分享单元,用于根据高维特征向量以及中文字符数量计算板书之间的相似度,并根据相似度向用户进行双向分享,相似度计算采用以下计算模型:
S1=D(V1,V2)*(W2-X)
S2=D(V1,V2)*1
其中,V1表示根据本地用户的课件图像以及板书图像数据经过神经网络分析得到的高维特征向量,V2表示待匹配的课件图像以及板书图像数据经过神经网络分析得到的高维特征向量,D(V1,V2)表示两个高维特征向量之间的相似度,W2表示待匹配的目标板书的字数,X为补偿值;S1是忽略本地板书字数,考虑目标板书字数的相似度计算模型;S2是忽略本地及目标板书字数,考虑全局风格特征的相似度计算模型,在使用S2对板书进行粗筛选之后可以使用S1对结果进行细化。
2.如权利要求1所述的基于大数据和OCR的网络课堂中文板书结构化分享系统,其特征在于,所述图像获取单元还包括预处理模块,预处理模块用于对获得的板书图像进行底色添加、反色处理,从而得到符合网络常规设计参数的板书图像。
3.如权利要求1所述的基于大数据和OCR的网络课堂中文板书结构化分享系统,其特征在于,所述课件排版风格编码器、课件排版风格解码器是沙漏组合结构,采用卷积神经网络模块;所述板书书写风格编码器、板书书写风格解码器是沙漏组合结构,采用卷积神经网络模块。
4.如权利要求1所述的基于大数据和OCR的网络课堂中文板书结构化分享系统,其特征在于,所述全连接网络的推荐配置是4096、4096、1024、256、512。
5.如权利要求1所述的基于大数据和OCR的网络课堂中文板书结构化分享系统,其特征在于,所述OCR模块的识别结果是一组字符串,对字符串的字符进行过滤,统计中文字符数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州铁路职业技术学院,未经郑州铁路职业技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010109683.X/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置