[发明专利]在计算设备上自动为内容的可听部分加字幕在审

专利信息
申请号: 201980095398.2 申请日: 2019-06-03
公开(公告)号: CN113692619A 公开(公告)日: 2021-11-23
发明(设计)人: 阿萨·乔纳斯·伊夫里·布洛克;埃利奥特·查尔斯·伯福德;安东尼·菲利斯·特里帕尔蒂;斯蒂芬尼·比安卡·皮塔罗;希瑟·帕特里夏·卢波尔德;布莱恩·克姆勒;凯尔斯·霍普·万德曼;纳达夫·巴尔;罗伯特·詹姆斯·贝利;丹尼尔·科亨;米歇尔·拉玛诺维奇;托马斯·威登·休姆;尼可·基亚娜·布洛伊尔;本杰明·施莱辛格;贾斯汀·伍永·李;凯文·罗卡尔;艾瑞克·劳伦特 申请(专利权)人: 谷歌有限责任公司
主分类号: G10L21/10 分类号: G10L21/10;G10L25/78;G10L15/26;G10L21/06;G10L25/84
代理公司: 中原信达知识产权代理有限责任公司 11219 代理人: 李佳;周亚荣
地址: 美国加利*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 计算 设备 自动 内容 可听 部分 字幕
【权利要求书】:

1.一种计算机实现的方法,包括:

由计算设备的处理器从所述计算设备的音频混合器获得从在所述计算设备处执行的应用输出的音频数据,所述音频数据包括指示内容的可听部分的数据;

由所述处理器使用所述音频数据来确定所述音频数据是否是适合于加字幕的类型;

响应于确定所述音频数据是适合于加字幕的类型,由所述处理器确定所述内容的可听部分的描述;以及

在输出所述内容的视觉部分用于显示时,由所述处理器输出所述内容的可听部分的所述描述用于显示。

2.根据权利要求1所述的方法,其中,指示所述内容的可听部分的所述数据是非元数据,并且所述音频数据进一步包括元数据,其中,确定所述音频数据是否是适合于加字幕的类型包括:由所述处理器使用所述元数据来确定所述音频数据是否是适合于加字幕的类型。

3.根据权利要求1和权利要求2中的任一项所述的方法,其中,所述内容的可听部分的所述描述包括来自所述内容的可听部分的口头音频的转录。

4.根据权利要求1-3中的任一项所述的方法,其中,所述内容的可听部分的所述描述包括来自所述内容的可听部分的非口头音频的描述。

5.根据权利要求4所述的方法,其中,所述非口头音频包括来自特定源的噪声,并且来自所述特定源的所述噪声的描述包括所述特定源的指示。

6.根据权利要求5所述的方法,其中:

所述噪声包括来自动物源的动物噪声,或

所述噪声包括来自非动物源的环境噪声。

7.根据权利要求1-6中的任一项所述的方法,其中,确定所述内容的可听部分的所述描述包括:由所述计算设备的所述处理器执行机器学习模型,所述机器学习模型被训练以从所述音频数据中确定描述以确定所述内容的可听部分的所述描述。

8.根据权利要求7所述的方法,其中,所述机器学习模型包括端到端循环神经网络换能器自动语音辨识模型。

9.根据权利要求1-8中的任一项所述的方法,其中,指示所述内容的可听部分的所述数据包括尚未被注释用于加字幕的未注释数据。

10.根据权利要求1-9中的任一项所述的方法,其中,所述描述包括指示从所述内容的可听部分中提取的非口头音频的文本。

11.根据权利要求1-10中的任一项所述的方法,其中,所述描述包括识别所述内容的可听部分的不同部分的人类源或非人类源的文本。

12.根据权利要求1-11中的任一项所述的方法,其中,输出所述内容的可听部分的所述描述包括:由所述处理器输出所述内容的可听部分的所述描述作为除所述内容的视觉部分之外以及除所述应用的图形用户界面之外的持久性元素,以用于显示。

13.根据权利要求12所述的方法,进一步包括:

响应于由所述处理器接收与所述持久性元素相关联的用户输入,修改所述持久性元素的大小以显示从所述内容的可听部分中生成的先前或后续描述。

14.一种包括至少一个处理器的计算设备,所述至少一个处理器被配置为执行权利要求1-13所述的方法中的任一个。

15.一种包括指令的计算机可读存储介质,所述指令在被执行时配置计算设备的处理器以执行权利要求1-13所述的方法中的任一个。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201980095398.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top