[发明专利]用于把图像的说明插入到音频记录中的系统和方法有效
申请号: | 200710169269.2 | 申请日: | 2007-11-08 |
公开(公告)号: | CN101178924A | 公开(公告)日: | 2008-05-14 |
发明(设计)人: | 彼德·C.·伯伊勒;张宇 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G11B27/034 | 分类号: | G11B27/034;G06K9/00;G06F17/30 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 | 代理人: | 董莘 |
地址: | 美国*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 图像 说明 插入 音频 记录 中的 系统 方法 | ||
版权通告
本专利文件的公开内容的一部分包含受到版权保护的材料。版权拥有者不反对影印复制如出现在专利与商标局专利文件或记录中的那样的专利文件或专利公开内容,否则无论如何保留所有的版权权利。
技术领域
本发明涉及用于把图像的说明插入到音频记录中的系统和方法。
背景技术
以音频格式记录讲课或演讲可以是在直接出席以外传播信息的方便有效的方式。然而,如果演讲包含图像、图表和图形,缺乏视觉内容可能对于传送的有效性造成很大的影响。所需要的是用于把图像的说明插入到音频记录中的方法和系统。
发明内容
本发明涉及用于把图像的说明插入到音频记录中的系统和方法。
在实施例中,方法从通过解密非文本内容、汇编任何元标记信息、收集光学字符识别(OCR)数据等等而解释图像开始。然后该方法集合、过滤和优先顺序化(prioritize)信息,以创建图像的有用、简明的不可见(例如,音频、文本等等)说明。这个图像解释和说明的结果在图像不可得到时,诸如当收听音频记录或听文本到语音系统读文本时增大了不可见内容。例如,系统可以解释常用的呈现和图形程序,诸如Microsoft PowerPointTM和VisioTM,并把图像的说明插入到呈现的音频记录中。
一方面,提供了一种把图像的说明插入到音频记录中的方法,包括:解释图像和产生包括至少一个图像关键字的图像的文字说明;把音频记录解析成多个音频剪辑,以及产生每个音频剪辑的转录本(transcription),每个音频剪辑转录本包括至少一个音频关键字;计算至少一个图像关键字与每个音频剪辑的至少一个音频关键字的相似性距离;以及选择具有到至少一个图像关键字的最短的相似性距离的音频剪辑转录本作为插入图像的文字说明的位置。
在一个实施例中,该方法还包括把图像的文字说明附加到选择的音频剪辑,以产生包括图像的至少一个解释性文字说明的增大的音频记录。
在另一个实施例中,该方法还包括提供至少一个解释图像的模板,该至少一个模板包括至少一个图像解释部件,用于产生图像的文字说明。
在另一个实施例中,该方法还包括提供光学字符识别(OCR)技术、边缘寻找技术、彩色边缘寻找技术、曲线寻找技术、形状寻找技术、和对比度寻找技术中的至少一项技术作为在该至少一个模板中的图像解释部件。
在另一个实施例中,该方法还包括把音频记录解析为基本上相同长度的多个音频剪辑,以及调节每个音频剪辑的长度以在语音的自然停顿处结束。
在另一个实施例中,该方法还包括通过计算在图像的至少一个图像关键字与音频剪辑的至少一个音频关键字之间的相似性距离而计算在图像与音频剪辑之间的相似性距离。
在另一个实施例中,该方法还包括通过计算在分级结构语义电子字典中这些关键字之间的路径长度而得到在至少一个图像关键字与至少一个音频关键字之间的相似性距离。
另一方面,提供了一种用于把图像的说明插入到音频记录中的系统,包括:解释装置,用于解释图像和产生包括至少一个图像关键字的图像的文字说明;解析装置,用于把音频记录解析成多个音频剪辑,和产生每个音频剪辑的转录本,每个音频剪辑转录本包括至少一个音频关键字;计算装置,用于计算该至少一个图像关键字与每个音频剪辑的该至少一个音频关键字之间的相似性距离;选择装置,用于选择具有到至少一个图像关键字的最短的相似性距离的音频剪辑转录本作为插入图像的文字说明的位置。
在一个实施例中,该系统还包括附加装置,用于把图像的文字说明附加到选择的音频剪辑,以产生包括图像的至少一个解释性文字说明的增大的音频记录。
在另一个实施例中,该系统还包括至少一个解释图像的模板,该至少一个模板包括至少一个图像解释部件,用于产生图像的文字说明。
在另一个实施例中,该系统还包括光学字符识别(OCR)技术、边缘寻找技术、彩色边缘寻找技术、曲线寻找技术、形状寻找技术、和对比度寻找技术中的至少一项技术作为在该至少一个模板中的图像解释部件。
在另一个实施例中,该系统被配置成把音频记录解析为基本上相同长度的多个音频剪辑,以及调节每个音频剪辑的长度以在语音的自然停顿处结束。
在另一个实施例中,该系统被配置成通过计算在图像的至少一个图像关键字与音频剪辑的至少一个音频关键字之间的相似性距离而计算在图像与音频剪辑之间的相似性距离。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710169269.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:计算机系统、存储器管理方法及其程序
- 下一篇:LCD控制板底座及其制造方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序