[发明专利]音频数据的处理在审
申请号: | 201380077061.1 | 申请日: | 2013-05-31 |
公开(公告)号: | CN105378830A | 公开(公告)日: | 2016-03-02 |
发明(设计)人: | M.卡迪卡曼内森;D.普耶;T.B.罗斯彻尔 | 申请(专利权)人: | 朗桑有限公司 |
主分类号: | G10L15/065 | 分类号: | G10L15/065;G10L15/197;G10L15/26;G06F17/30;G06F17/20;G06F17/24;G06F17/27;G10L15/22 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 王岳;陈岚 |
地址: | 英国*** | 国省代码: | 英国;GB |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 数据 处理 | ||
1.一种用于处理音频数据的方法,其包括:
基于表示与所述音频数据相关联的抄本的文本数据来生成抄本语言模型;
利用抄本引擎处理所述音频数据以至少确定针对抄本引擎的文本输出中的多个语言元素的置信度值的集合,抄本引擎使用所述抄本语言模型;以及
基于所述置信度值的集合来确定文本数据是否与所述音频数据相关联。
2.如权利要求1所述的方法,其中所述音频数据包括用于媒体项的多个音轨,每个音轨具有相关联的语言,并且所述方法进一步包括:
访问多个抄本,每个抄本与特定语言相关联;
其中生成抄本语言模型的步骤包括针对多个抄本中的每个抄本生成抄本语言模型;
其中处理所述音频数据的步骤包括利用抄本引擎处理至少一个音轨以确定与每个抄本语言模型的使用相关联的置信度值;以及
其中确定文本数据是否与所述音频数据的至少部分相关联的步骤包括基于确定的置信度值来确定至少一个音轨和至少一个抄本之间的匹配。
3.如权利要求1所述的方法,其中处理所述音频数据的步骤包括产生具有相关联的定时信息的文本输出,并且所述方法进一步包括:
响应于文本数据与所述音频数据的至少部分相关联的确定,将文本输出与表示所述抄本的文本数据调和,从而将定时信息附加到抄本。
4.如权利要求1所述的方法,其中处理所述音频数据包括确定置信度值的矩阵。
5.如权利要求1所述的方法,其中抄本语言模型是统计N元语法模型,比使用表示所述抄本的所述文本数据来配置。
6.如权利要求1所述的方法,其中抄本引擎使用表示所说的语言中的音素声音模式的声学模型。
7.如权利要求6所述的方法,其中抄本语言模型具体化至少关于所说的语言内的词的出现的统计数据,并且其中抄本引擎将发音词典用于词到音素声音模式。
8.如权利要求1所述的方法,进一步包括,在生成抄本语言模型之前:
使表示所述抄本的文本数据规范化。
9.如权利要求1所述的方法,其中所述音频数据形成媒体广播的部分,并且抄本包括用于所述媒体广播的隐藏字幕数据。
10.一种处理媒体数据的系统,所述媒体数据至少包括音频部分,所述系统包括:
第一组件,其基于表示所述音频部分内的可听见语言元素的文本数据而指令语言模型的配置;以及
第二组件,其基于所述语言模型而指令媒体数据的音频部分到文本等同物的转换,所述转换输出针对文本等同物中的多个语言元素的置信度值的集合,
其中所述系统基于所述置信度值的集合来确定文本数据是否与所述音频数据相关联。
11.如权利要求10所述的系统,进一步包括:
第三组件,其将文本等同物与接收的文本数据相比较,从而将所述定时信息添加到接收的文本数据;以及
第四组件,其基于所述置信度值的集合来确定文本数据是否与所述音频数据的至少部分相关联,
其中第三组件被布置成响应于来自第四组件的正确定而执行比较。
12.如权利要求10所述的系统,包括:
语音到文本引擎,其通信地耦合到第二组件以将媒体数据的音频部分转换为文本等同物,语音到文本引擎利用语言模型和声音模型,声音模型表示所说的语言中的声音模式,并且语言模型表示书写语言中的词模式。
13.如权利要求10所述的系统,进一步包括:
接口,其至少接收与媒体数据相关联的文本数据,其中接口被布置成将所述接收的文本数据转换为规范的形式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于朗桑有限公司,未经朗桑有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380077061.1/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置