[发明专利]用于自动字幕显示的系统和方法有效
申请号: | 201910930371.2 | 申请日: | 2019-09-29 |
公开(公告)号: | CN110996163B | 公开(公告)日: | 2023-08-01 |
发明(设计)人: | G.加纳佩西 | 申请(专利权)人: | 哈曼国际工业有限公司 |
主分类号: | H04N21/435 | 分类号: | H04N21/435;H04N21/488;H04N21/485;H04N21/43;H04N21/414;H04N5/278 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 高巍 |
地址: | 美国康*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 自动 字幕 显示 系统 方法 | ||
1.一种用于自动字幕显示的方法,所述方法包括:
由控制装置检测乘客语音;
由控制装置检测车辆中媒体的音频;
由控制装置基于所述乘客语音确定用于空间的对话语言,其中所述空间是车辆的乘客厢,其中确定对话语言包括识别话音位置,以及包括声学建模、关键词辨识或时间模式中的至少一个,并且其中确定对话语言还包括过滤掉车辆中媒体的音频;
由所述控制装置识别在所述空间中在显示器上呈现的显示内容;
由所述控制装置基于针对所述空间确定的所述对话语言而请求用于所述显示内容的字幕数据,其中,如果针对所述空间确定多于一个对话语言,则选择检测到具有乘客语音的更多词语计数的对话语言;以及由所述控制装置控制用于所述显示内容的字幕数据的呈现,以便在所述装置上输出,其中针对所确定的对话语言选择呈现的字幕数据。
2.如权利要求1所述的方法,其中确定对话语言包括对在所述空间中检测到的图像数据执行面部辨识操作。
3.如权利要求1所述的方法,其中确定对话语言包括确定所述空间中的乘客的用户简档设置。
4.如权利要求1所述的方法,其中所述空间与显示装置的观看区域相关联,并且对话语言包括在所述观看区域中检测到的话音数据。
5.如权利要求1所述的方法,其中识别显示内容包括确定所述显示内容的标题、来源和标识符中的至少一个。
6.如权利要求1所述的方法,其中字幕数据包括用于所述显示内容的音频和语音数据的文本和图形表示中的至少一个。
7.如权利要求1所述的方法,其中控制所述字幕数据的呈现包括将所述字幕数据的输出与所述显示内容的定时同步。
8.如权利要求1所述的方法,所述方法还包括显示针对所述字幕数据的通知以及接收针对所述字幕数据的用户输入,其中所述字幕数据的呈现是响应于接收到的用户输入。
9.一种用于自动字幕显示的系统,所述系统包括:
显示器;以及
控制装置,所述控制装置耦合到所述显示器,其中所述控制装置被配置成:
识别在空间中在显示器上呈现的显示内容;
基于乘客语音确定对话语言,其中,如果针对所述空间确定多于一个对话语言,则选择检测到具有乘客语音的更多词语计数的对话语言;
基于针对所述空间确定的对话语言而请求用于所述显示内容的字幕数据,其中所述空间是车辆的乘客厢,其中存储所述字幕数据的来源不同于所述显示内容的来源;以及
控制用于所述显示内容的字幕数据的呈现,以便在装置上输出,其中针对所确定的对话语言选择呈现的字幕数据。
10.如权利要求9所述的系统,其中确定对话语言包括对在所述空间中检测到的乘客话音数据执行语音辨识操作。
11.如权利要求9所述的系统,其中确定对话语言包括对在所述空间中检测到的图像数据执行面部辨识操作。
12.如权利要求9所述的系统,其中确定对话语言包括确定所述空间中的乘客的用户简档设置。
13.如权利要求9所述的系统,其中所述空间与显示装置的观看区域相关联,并且对话语言包括在所述观看区域中检测到的话音数据。
14.如权利要求9所述的系统,其中识别显示内容包括确定所述显示内容的标题、来源和标识符中的至少一个。
15.如权利要求9所述的系统,其中字幕数据包括用于所述显示内容的音频和语音数据的文本和图形表示中的至少一个。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈曼国际工业有限公司,未经哈曼国际工业有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910930371.2/1.html,转载请声明来源钻瓜专利网。