[发明专利]在计算设备上自动为内容的可听部分加字幕在审
申请号: | 201980095398.2 | 申请日: | 2019-06-03 |
公开(公告)号: | CN113692619A | 公开(公告)日: | 2021-11-23 |
发明(设计)人: | 阿萨·乔纳斯·伊夫里·布洛克;埃利奥特·查尔斯·伯福德;安东尼·菲利斯·特里帕尔蒂;斯蒂芬尼·比安卡·皮塔罗;希瑟·帕特里夏·卢波尔德;布莱恩·克姆勒;凯尔斯·霍普·万德曼;纳达夫·巴尔;罗伯特·詹姆斯·贝利;丹尼尔·科亨;米歇尔·拉玛诺维奇;托马斯·威登·休姆;尼可·基亚娜·布洛伊尔;本杰明·施莱辛格;贾斯汀·伍永·李;凯文·罗卡尔;艾瑞克·劳伦特 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G10L21/10 | 分类号: | G10L21/10;G10L25/78;G10L15/26;G10L21/06;G10L25/84 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 李佳;周亚荣 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 计算 设备 自动 内容 可听 部分 字幕 | ||
1.一种计算机实现的方法,包括:
由计算设备的处理器从所述计算设备的音频混合器获得从在所述计算设备处执行的应用输出的音频数据,所述音频数据包括指示内容的可听部分的数据;
由所述处理器使用所述音频数据来确定所述音频数据是否是适合于加字幕的类型;
响应于确定所述音频数据是适合于加字幕的类型,由所述处理器确定所述内容的可听部分的描述;以及
在输出所述内容的视觉部分用于显示时,由所述处理器输出所述内容的可听部分的所述描述用于显示。
2.根据权利要求1所述的方法,其中,指示所述内容的可听部分的所述数据是非元数据,并且所述音频数据进一步包括元数据,其中,确定所述音频数据是否是适合于加字幕的类型包括:由所述处理器使用所述元数据来确定所述音频数据是否是适合于加字幕的类型。
3.根据权利要求1和权利要求2中的任一项所述的方法,其中,所述内容的可听部分的所述描述包括来自所述内容的可听部分的口头音频的转录。
4.根据权利要求1-3中的任一项所述的方法,其中,所述内容的可听部分的所述描述包括来自所述内容的可听部分的非口头音频的描述。
5.根据权利要求4所述的方法,其中,所述非口头音频包括来自特定源的噪声,并且来自所述特定源的所述噪声的描述包括所述特定源的指示。
6.根据权利要求5所述的方法,其中:
所述噪声包括来自动物源的动物噪声,或
所述噪声包括来自非动物源的环境噪声。
7.根据权利要求1-6中的任一项所述的方法,其中,确定所述内容的可听部分的所述描述包括:由所述计算设备的所述处理器执行机器学习模型,所述机器学习模型被训练以从所述音频数据中确定描述以确定所述内容的可听部分的所述描述。
8.根据权利要求7所述的方法,其中,所述机器学习模型包括端到端循环神经网络换能器自动语音辨识模型。
9.根据权利要求1-8中的任一项所述的方法,其中,指示所述内容的可听部分的所述数据包括尚未被注释用于加字幕的未注释数据。
10.根据权利要求1-9中的任一项所述的方法,其中,所述描述包括指示从所述内容的可听部分中提取的非口头音频的文本。
11.根据权利要求1-10中的任一项所述的方法,其中,所述描述包括识别所述内容的可听部分的不同部分的人类源或非人类源的文本。
12.根据权利要求1-11中的任一项所述的方法,其中,输出所述内容的可听部分的所述描述包括:由所述处理器输出所述内容的可听部分的所述描述作为除所述内容的视觉部分之外以及除所述应用的图形用户界面之外的持久性元素,以用于显示。
13.根据权利要求12所述的方法,进一步包括:
响应于由所述处理器接收与所述持久性元素相关联的用户输入,修改所述持久性元素的大小以显示从所述内容的可听部分中生成的先前或后续描述。
14.一种包括至少一个处理器的计算设备,所述至少一个处理器被配置为执行权利要求1-13所述的方法中的任一个。
15.一种包括指令的计算机可读存储介质,所述指令在被执行时配置计算设备的处理器以执行权利要求1-13所述的方法中的任一个。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980095398.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:相位同步电路
- 下一篇:可时限地差动的末级齿轮装置
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法