[发明专利]用于把图像的说明插入到音频记录中的系统和方法有效

专利信息
申请号: 200710169269.2 申请日: 2007-11-08
公开(公告)号: CN101178924A 公开(公告)日: 2008-05-14
发明(设计)人: 彼德·C.·伯伊勒;张宇 申请(专利权)人: 国际商业机器公司
主分类号: G11B27/034 分类号: G11B27/034;G06K9/00;G06F17/30
代理公司: 中国国际贸易促进委员会专利商标事务所 代理人: 董莘
地址: 美国*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 图像 说明 插入 音频 记录 中的 系统 方法
【说明书】:

版权通告

专利文件的公开内容的一部分包含受到版权保护的材料。版权拥有者不反对影印复制如出现在专利与商标局专利文件或记录中的那样的专利文件或专利公开内容,否则无论如何保留所有的版权权利。

技术领域

本发明涉及用于把图像的说明插入到音频记录中的系统和方法。

背景技术

以音频格式记录讲课或演讲可以是在直接出席以外传播信息的方便有效的方式。然而,如果演讲包含图像、图表和图形,缺乏视觉内容可能对于传送的有效性造成很大的影响。所需要的是用于把图像的说明插入到音频记录中的方法和系统。

发明内容

本发明涉及用于把图像的说明插入到音频记录中的系统和方法。

在实施例中,方法从通过解密非文本内容、汇编任何元标记信息、收集光学字符识别(OCR)数据等等而解释图像开始。然后该方法集合、过滤和优先顺序化(prioritize)信息,以创建图像的有用、简明的不可见(例如,音频、文本等等)说明。这个图像解释和说明的结果在图像不可得到时,诸如当收听音频记录或听文本到语音系统读文本时增大了不可见内容。例如,系统可以解释常用的呈现和图形程序,诸如Microsoft PowerPointTM和VisioTM,并把图像的说明插入到呈现的音频记录中。

一方面,提供了一种把图像的说明插入到音频记录中的方法,包括:解释图像和产生包括至少一个图像关键字的图像的文字说明;把音频记录解析成多个音频剪辑,以及产生每个音频剪辑的转录本(transcription),每个音频剪辑转录本包括至少一个音频关键字;计算至少一个图像关键字与每个音频剪辑的至少一个音频关键字的相似性距离;以及选择具有到至少一个图像关键字的最短的相似性距离的音频剪辑转录本作为插入图像的文字说明的位置。

在一个实施例中,该方法还包括把图像的文字说明附加到选择的音频剪辑,以产生包括图像的至少一个解释性文字说明的增大的音频记录。

在另一个实施例中,该方法还包括提供至少一个解释图像的模板,该至少一个模板包括至少一个图像解释部件,用于产生图像的文字说明。

在另一个实施例中,该方法还包括提供光学字符识别(OCR)技术、边缘寻找技术、彩色边缘寻找技术、曲线寻找技术、形状寻找技术、和对比度寻找技术中的至少一项技术作为在该至少一个模板中的图像解释部件。

在另一个实施例中,该方法还包括把音频记录解析为基本上相同长度的多个音频剪辑,以及调节每个音频剪辑的长度以在语音的自然停顿处结束。

在另一个实施例中,该方法还包括通过计算在图像的至少一个图像关键字与音频剪辑的至少一个音频关键字之间的相似性距离而计算在图像与音频剪辑之间的相似性距离。

在另一个实施例中,该方法还包括通过计算在分级结构语义电子字典中这些关键字之间的路径长度而得到在至少一个图像关键字与至少一个音频关键字之间的相似性距离。

另一方面,提供了一种用于把图像的说明插入到音频记录中的系统,包括:解释装置,用于解释图像和产生包括至少一个图像关键字的图像的文字说明;解析装置,用于把音频记录解析成多个音频剪辑,和产生每个音频剪辑的转录本,每个音频剪辑转录本包括至少一个音频关键字;计算装置,用于计算该至少一个图像关键字与每个音频剪辑的该至少一个音频关键字之间的相似性距离;选择装置,用于选择具有到至少一个图像关键字的最短的相似性距离的音频剪辑转录本作为插入图像的文字说明的位置。

在一个实施例中,该系统还包括附加装置,用于把图像的文字说明附加到选择的音频剪辑,以产生包括图像的至少一个解释性文字说明的增大的音频记录。

在另一个实施例中,该系统还包括至少一个解释图像的模板,该至少一个模板包括至少一个图像解释部件,用于产生图像的文字说明。

在另一个实施例中,该系统还包括光学字符识别(OCR)技术、边缘寻找技术、彩色边缘寻找技术、曲线寻找技术、形状寻找技术、和对比度寻找技术中的至少一项技术作为在该至少一个模板中的图像解释部件。

在另一个实施例中,该系统被配置成把音频记录解析为基本上相同长度的多个音频剪辑,以及调节每个音频剪辑的长度以在语音的自然停顿处结束。

在另一个实施例中,该系统被配置成通过计算在图像的至少一个图像关键字与音频剪辑的至少一个音频关键字之间的相似性距离而计算在图像与音频剪辑之间的相似性距离。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200710169269.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top