[发明专利]一种用于形成文字索引的多媒体系统及处理方法有效
申请号: | 201410737502.2 | 申请日: | 2014-12-05 |
公开(公告)号: | CN104408162B | 公开(公告)日: | 2017-10-31 |
发明(设计)人: | 李荣凯;秦衡;谢清玉;张耀坤;李经纬 | 申请(专利权)人: | 国家电网公司;国网技术学院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27;H04L29/06 |
代理公司: | 北京青松知识产权代理事务所(特殊普通合伙)11384 | 代理人: | 郑青松 |
地址: | 100031 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 形成 文字 索引 多媒体 系统 处理 方法 | ||
技术领域
本发明涉及多媒体领域,特别涉及能够形成文字索引的多媒体领域。
背景技术
随着网络和多媒体技术的广泛应用,网络培训已成为员工培训的必然发展趋势。然而,网络培训面临着“来源单一、脱离实践、滞后现场”的问题,尤其是缺少以现场案例为内容的生产技能类培训,这势必会影响以生产技能操作为主的员工培训效果。因此,积极引入现场案例教学,探索智能终端和移动网络的应用,将成为网络培训和资源建设的新方向。
发明内容
本发明涉及一种多媒体系统,包括拍摄终端、服务器和查询终端;其特征在于:服务器包括第二传输单元、解析单元、数据库、第二存储单元;其中,所述服务器用于读取拍摄终端上传的文字,并形成文字索引。
本发明还涉及一种使用所述多媒体系统的多媒体处理方法,其特征在于包括以下步骤:
步骤S100,用户使用拍摄终端拍摄多媒体,所述多媒体包括视频和音频;当在某一位置和/或变焦拍摄时,由计时单元记录下拍摄的开始时间和结束时间;随后,计时单元将事件、开始时间和结束时间一并保存到第一存储单元的记录表中,其中所述事件包括位置、变焦;
步骤S200,将多媒体中的音频转换为文字,转换后,在拍摄终端上显示给用户,供用户确认;如果用户认为转换的文字内容有错误或需要调整,则使用拍摄终端的第一输入单元进行修改;
步骤S220,拍摄终端通过第一传输单元将拍摄的多媒体、第一存储单元中的记录表、以及经过用户确认的文字上传到服务器的第二传输单元,服务器将拍摄的多媒体保存到数据库中,并记录多媒体ID,所述多媒体ID是上传的多媒体的唯一标识;
步骤S240,服务器根据记录表中的事件、开始时间和结束时间,使用解析单元从多媒体的视频中提取关键帧,并确定关键帧的录制时长,所述关键帧为拍摄终端在同一事件下拍摄的视频帧的代表;
步骤S260,得到视频中每个事件对应的关键帧和事件的持续时间,其中根据每个事件的开始时间和结束时间获取持续时间;
步骤S300,服务器读取所述上传的文字,根据文字中的标点符号,将文字切分为基本字符串单元;
步骤S310,根据分词词典,对基本字符串单元进行正向最大分词匹配和逆向最大分词匹配,形成分词扫描字符串;
步骤S320,判断分词扫描字符串是否存在歧义;如果存在歧义,则消除歧义,形成分词结果字符串;如果不存在歧义,则直接将分词扫描字符串作为分词结果字符串;
其中,对于存在歧义的字符串ABC,根据以下公式计算I(A,B)和I(B,C)的值:
其中A、B、C为单个字或词,n(x,y)为x,y在分词词典中出现的次数,n(x)为x在分词词典中出现的次数,n(y)分别为y在分词词典中出现的次数,N为分词词典的总词数;
比较I(A,B)和I(B,C)的值:
如果I(A,B)-I(B,C)>i,那么采用AB/C的切分;
如果I(B,C)-I(A,B)>i,那么采用A/BC的切分;
其中,i为第一阀值,优选为0;
如果非上述两种情况,则利用如下公式:
其中,f(AB)表示在所述字符串中AB出现的次数;f(BC)表示在所述字符串中BC出现的次数;Max(f(AB),f(BC))的值为f(AB)和f(BC)中较大的;比较Δf与β,
其中β为第二阈值,优选为0.75;
如果Δf>β,则将字符串ABC切分为“AB/C”;
如果Δf<=β,则将字符串ABC切分为“A/BC”;
步骤S330,将经过分词后的字符串汇聚成文字索引;
步骤S340,对于每一个多媒体,服务器形成多媒体索引表,并存储在第二存储单元中;所述多媒体索引表包括:多媒体ID、文字索引、关键帧集合以及事件持续时间集合;
步骤S400,用户使用查询终端查找所述多媒体,并将检索结果呈现给用户。
本发明的多媒体系统及多媒体处理方法特别适用于以生产现场为背景的基于移动智能终端的现场案例培训,获得了以生产实践为基础、培训内容来源多样化的有益效果。并且,本发明的多媒体系统及多媒体处理方法能够从上传的文字中快速、准确地提取出文字索引,为后续的多媒体查询提供了更高的准确性和效率。
附图说明
图1是多媒体系统的框图;
图2是拍摄终端位置变化的示意图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家电网公司;国网技术学院,未经国家电网公司;国网技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410737502.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种绳索型脊椎侧弯康复医疗机器人
- 下一篇:一种多功能气囊式肛管