[发明专利]一种多媒体字幕识别显示方法在审

申请号：	201811420700.0	申请日：	2018-11-26
公开（公告）号：	CN111221986A	公开（公告）日：	2020-06-02
发明（设计）人：	不公告发明人	申请（专利权）人：	谢丽娟
主分类号：	G06F16/43	分类号：	G06F16/43;G06F16/438;G06F16/73;G06F16/738;G10L15/26
代理公司：	暂无信息	代理人：	暂无信息
地址：	425200 湖南***	国省代码：	湖南;43
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种多媒体字幕识别显示方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种多媒体字幕识别显示方法，包括建立文字播放的声音波形特征与文字关联的数据库；读入多媒体文件；将该多媒体文件的声音数据转换成波形数据并提取所述波形数据的波形特征；根据波形特征调集数据库中对应地文字；输出文字字幕。本发明一种多媒体字幕识别显示方法，自动提取声音进行识别配置字幕，不仅方便原始多媒体数据的字幕配置，也便于一些已经发布的没有字幕的多媒体文件自行配置字幕。

技术领域

本发明涉及多媒体处理技术领域，具体而言，是一种多媒体字幕识别显示方法。

背景技术

随着科技进步，随身电子装置的功能愈来愈多元，愈来愈多的随身电子装置提供文字阅读、聆听音乐或是影片观看的功能，如一般熟知的MP3装置，或是具有音像播放的移动电话、PDA等。

由于数字化的多媒体(包括文字、图像、音乐)文件中载有各种信息，故通过上述电子装置播放过程通常可同时显示当中的信息，如播放MP3声音文件时，可以同时提取出歌词，并再结合后播放。或者播放影像文件时，显示字幕信息等。

但歌词或者字幕传统的配置方式是人工配置导入，效率很低；而且有多媒体文件原始就没有字幕。

有鉴于此，特提出本发明。

发明内容

本发明的目的是提供一种新的多媒体字幕识别显示方法，克服上述不足。

为了实现上述目的，本发明提供的一种多媒体字幕识别显示方法，包括

建立文字播放的声音波形特征与文字关联的数据库；

读入多媒体文件；

将该多媒体文件的声音数据转换成波形数据并提取所述波形数据的波形特征；

根据波形特征调集数据库中对应地文字；

输出文字字幕。

所述的多媒体字幕识别显示方法中，建立显示解析度规则，包括：

根据多媒体文件显示解析度，动态调整显示字幕的段落位置与显示字幕的大小。

所述的多媒体字幕识别显示方法中，建立系统语系规则，包括确定多媒体文件所属语系，根据多媒体文件所属语系将提取的波性特征关联数据库中对应地语系文字。

本发明提具有如下有益效果；

本发明一种多媒体字幕识别显示方法，自动提取声音进行识别配置字幕，不仅方便原始多媒体数据的字幕配置，也便于一些已经发布的没有字幕的多媒体文件自行配置字幕。

具体实施方式

下面对本发明技术方案进行详细阐述，以便于理解。

一种多媒体字幕识别显示方法，包括

建立文字播放的声音波形特征与文字关联的数据库；

读入多媒体文件；

将该多媒体文件的声音数据转换成波形数据并提取所述波形数据的波形特征；

根据波形特征调集数据库中对应地文字；

输出文字字幕。

所述的多媒体字幕识别显示方法中，建立显示解析度规则，包括：

根据多媒体文件显示解析度，动态调整显示字幕的段落位置与显示字幕的大小。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于谢丽娟，未经谢丽娟许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201811420700.0/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种多媒体字幕识别显示方法在审

专利文献下载